목차
R과 파이썬을 각각 이용하여 작성하시오 (결과+분석)
1(10점). 교재 연습문제 1장(p.38) 4번
(1)R을 이용하여 산점도행렬, 별그림, 얼굴그림을 그리고 해석하시오.
(2)“longley" 데이터를 CSV 파일로 저장하시오.
(3)파이썬을 이용하여 데이터를 읽고, 산점도행렬을 그리시오. 출력결과를 비교하여 설명하시오.
2(10점). 교재 연습문제 2장(p.78) 4번
(1) R을 이용하여 주성분분석을 실행하고 해석하시오.
①자료 가져오기 및 요약통계량 ② 주성분분석 실행하기
③주성분분석 결과
(2) 파이썬을 이용하여 주성분분석을 실행하고 R의 결과와 비교, 분석하시오.
①데이터 읽기 및 기술통계량 구하기 ②변수표준화
③파이썬 초기 주성분분석 ④파이썬 주성분분석
3(10점). 교재 연습문제 4장(p.176) 5번
R
(1) 각 변수별로 관찰값들을 표준화하시오.
(2) 와드의 방법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(3) 최장연결법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(4) 와드의 방법과 최장연결법을 이용한 군집분석의 결과를 서로 비교하시오.
(5) K-평균 군집분석방법을 이용하여 6개 군집에 대한 군집분석을 실시하시오. 각 군집별 평균을 이용하여, 군집별 특성을 기술하시오.
Python
(1) 각 변수별로 관찰값들을 표준화하시오.
(2) 와드의 방법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(3) 최장연결법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(4) 와드의 방법과 최장연결법을 이용한 군집분석의 결과를 서로 비교하시오.
(5) K-평균 군집분석방법을 이용하여 6개 군집에 대한 군집분석을 실시하시오. 각 군집별 평균을 이용하여, 군집별 특성을 기술하시오.
4. 참고문헌
1(10점). 교재 연습문제 1장(p.38) 4번
(1)R을 이용하여 산점도행렬, 별그림, 얼굴그림을 그리고 해석하시오.
(2)“longley" 데이터를 CSV 파일로 저장하시오.
(3)파이썬을 이용하여 데이터를 읽고, 산점도행렬을 그리시오. 출력결과를 비교하여 설명하시오.
2(10점). 교재 연습문제 2장(p.78) 4번
(1) R을 이용하여 주성분분석을 실행하고 해석하시오.
①자료 가져오기 및 요약통계량 ② 주성분분석 실행하기
③주성분분석 결과
(2) 파이썬을 이용하여 주성분분석을 실행하고 R의 결과와 비교, 분석하시오.
①데이터 읽기 및 기술통계량 구하기 ②변수표준화
③파이썬 초기 주성분분석 ④파이썬 주성분분석
3(10점). 교재 연습문제 4장(p.176) 5번
R
(1) 각 변수별로 관찰값들을 표준화하시오.
(2) 와드의 방법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(3) 최장연결법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(4) 와드의 방법과 최장연결법을 이용한 군집분석의 결과를 서로 비교하시오.
(5) K-평균 군집분석방법을 이용하여 6개 군집에 대한 군집분석을 실시하시오. 각 군집별 평균을 이용하여, 군집별 특성을 기술하시오.
Python
(1) 각 변수별로 관찰값들을 표준화하시오.
(2) 와드의 방법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(3) 최장연결법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(4) 와드의 방법과 최장연결법을 이용한 군집분석의 결과를 서로 비교하시오.
(5) K-평균 군집분석방법을 이용하여 6개 군집에 대한 군집분석을 실시하시오. 각 군집별 평균을 이용하여, 군집별 특성을 기술하시오.
4. 참고문헌
본문내용
얼굴그림은 열굴의 각 특성을 변수와 대응시켜 관찰값을 표시한 것이다.
얼굴그림은 다변량 변수의 속성값들을 15가지의 얼굴의 생김새(얼굴 높이, 얼굴 넓이, 입 높이, 입 넓이 등) 특성에 매핑해서 얼굴 모양이 달라지게 하는 방식이다.
위 결과의 effect of variables에 얼굴의 특성과 매핑된 변수가 나열되어 있다.
얼굴그림은 얼굴 모양을 가지고 데이터 관측치들의 특성을 직관적으로 파악할 수 있다.
그러나 매핑된 변수가 많아 레이더 차트, 별그림, 평행좌표그림 등과 비교하면 불편하다는 단점도 있다.
face.type = 0 (line drawing faces)은 색깔 없이 선으로만 얼굴을 그린다.
face.type = 1 (the elements of the faces are painted)는 색깔도 같이 칠한다(디폴트).
face.type = 2 (Santa Claus faces are drawn)는 산타클로스 얼굴에 색을 칠한다.
얼굴의 폭(GNP)과 높이(GNP.deflator)가 커지고 있으므로 경제발전이 지속적으로 이루어지면서 물가는 꾸준히 상승하고 있음을 알 수 있다.
또한 인구에 해당하는 코의 높이(Population)도 계속 커지고 있어 인구도 꾸준히 증가하고 있음을 알 수 있다.
전체적으로 얼굴 크기가 시간에 따라 계속 커지고 있으므로, 앞서 설명한 것처럼 경제가 꾸준히 성장해오고 있음을 보여준다.
얼굴그림은 다변량 변수의 속성값들을 15가지의 얼굴의 생김새(얼굴 높이, 얼굴 넓이, 입 높이, 입 넓이 등) 특성에 매핑해서 얼굴 모양이 달라지게 하는 방식이다.
위 결과의 effect of variables에 얼굴의 특성과 매핑된 변수가 나열되어 있다.
얼굴그림은 얼굴 모양을 가지고 데이터 관측치들의 특성을 직관적으로 파악할 수 있다.
그러나 매핑된 변수가 많아 레이더 차트, 별그림, 평행좌표그림 등과 비교하면 불편하다는 단점도 있다.
face.type = 0 (line drawing faces)은 색깔 없이 선으로만 얼굴을 그린다.
face.type = 1 (the elements of the faces are painted)는 색깔도 같이 칠한다(디폴트).
face.type = 2 (Santa Claus faces are drawn)는 산타클로스 얼굴에 색을 칠한다.
얼굴의 폭(GNP)과 높이(GNP.deflator)가 커지고 있으므로 경제발전이 지속적으로 이루어지면서 물가는 꾸준히 상승하고 있음을 알 수 있다.
또한 인구에 해당하는 코의 높이(Population)도 계속 커지고 있어 인구도 꾸준히 증가하고 있음을 알 수 있다.
전체적으로 얼굴 크기가 시간에 따라 계속 커지고 있으므로, 앞서 설명한 것처럼 경제가 꾸준히 성장해오고 있음을 보여준다.
키워드
추천자료
<30점 만점> 2020학년도 파이썬과R 출석수업대체과제 한국방송통신대학교 통계데이터과학과
<70점 만점, A+> 2020학년도 파이썬과R 기말시험(온라인평가) 한국방송통신대학교 통계데이터...
(방송통신대 파이썬과R 출석수업대체과제물)파이썬과 R을 이용하여 다음 연습문제를 수행하고...
(2022년 방송통신대 다변량분석 출석과제물)연습문제 1장 p38 4번 연습문제 2장 p75 1번 연습...
2022년 2학기 방송통신대 파이썬과R 출석수업대체과제물)R을 사용하여 다음의 자료로 3개의 ...
방송통신대학교 2022년 2학기 중간 출석 수업 과제물 파이썬과R 30점 만점
방송통신대 파이썬과 R 연습문제 1장부터 7장까지 전부 풀이(중간, 기말시험 등 대비)
소개글