(30점 만점) 한국방송통신대학교 다변량분석 출석수업대체과제
본 자료는 9페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
해당 자료는 9페이지 까지만 미리보기를 제공합니다.
9페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

(30점 만점) 한국방송통신대학교 다변량분석 출석수업대체과제에 대한 보고서 자료입니다.

목차

<교재의 연습문제>
1장 1번 3번
2장 1번 4번
3장 1번 3번
4장 1번 3번

본문내용

1759
76
41.4
Dusseldorf
1693
78.5
60.2
Frankfurt
1650
74.5
60.4
Geneva
1880
95.9
90.3
Helsinki
1667
113.6
66.6
Hong Kong
2375
63.8
27.8
Houston
1978
71.9
46.3
Johannesburg
1945
51.1
24
Kuala Lumpur
2167
43.5
9.9
Lagos
1786
45.2
2.7
Lisbon
1742
56.2
18.8
London
1737
84.2
46.2
Los Angeles
2068
79.8
65.2
Luxembourg
1968
71.1
71.1
Madrid
1710
93.8
50
Manila
2268
40
4
Mexico City
1944
49.8
5.7
Milan
1773
82
53.3
Montreal
1827
72.7
56.3
Nairobi
1958
45
5.8
New York
1942
83.3
65.8
Nicosia
1825
47.9
28.3
Oslo
1583
115.5
63.7
Panama
2078
49.2
13.8
Paris
1744
81.6
45.9
Rio de Janeiro
1749
46.3
10.5
Sao Paulo
1856
48.9
11.1
Seoul
1842
58.3
32.7
Singpore
2042
64.4
16.1
Stockholm
1805
111.3
39.2
Sydney
1668
70.8
52.1
Taipei
2145
84.3
34.5
Tel Aviv
2015
67.3
27
Tokyo
1880
115
68
Toronto
1888
70.2
58.2
Vienna
1780
78
51.3
평균노동시간, 물가, 소득수준 등의 변수를 사용하여 46개 도시에 대한 군집분석을 다음과 같이 실시하라
(1) 각 변수의 표준화한 값을 구하라.
(2) 최장연결법을 이용하여 도시들을 군집화하고 수형도로 표현하라. 몇 개의 군집이 적절하다고 판단되는가?
(3) K-평균 군집분석방법을 이용하여 4개 군집에 대한 군집분석을 실시하라.
(4) K-평균 군집분석의 군집결과를 이용하여 판별분석을 수행하고, 군집분석의 타당성을 설명하라.
(1) 각 변수의 표준화한 값을 구하라.
pls() 패키지의 stdize() 함수를 이용하여 평균노동시간(Laborhour), 물가(price), 소득수준(income)의 변수값을 표준화한 결과는 아래의 화면과 같다.
(2) 최장연결법을 이용하여 도시들을 군집화하고 수형도로 표현하라. 몇 개의 군집이 적절하다고 판단되는가?
계층적 군집분석을 시행하기 위하여 hclust() 함수를 사용하였다. method 옵션을 “complete”로 설정하면 최장연결법(furthest-neighbor method or complete linkage method)이 된다. 아래의 화면은 최장연결법을 사용하여 46개 도시들을 군집화 하고, 수형도(dendrogram)로 나타낸 것이다. 크게 4개의 군집으로 나누어 볼 수 있는 것으로 보인다.
(3) K-평균 군집분석방법을 이용하여 4개 군집에 대한 군집분석을 실시하라.
앞에서 읽어들인 zcityprice.data를 가지고 K-평균 군집분석을 실시한 결과이다. 표준화를 수행한 후 군집의 개수가 K=4인 K-평균 균집분석을 수행하는 명령어는 아래와 같다. K-평균 군집분석 결과에는 최종군집의 중심값 및 관찰치별 소속 군집분석의 결과를 보여준다.
(4) K-평균 군집분석의 군집결과를 이용하여 판별분석을 수행하고, 군집분석의 타당성을 설명하라.
판별분석을 통해 분류된 그룹이 K-평균 군집분석의 군집결과 나타난 그룹과 얼마나 일치하는지를 대조하여 군집분석이 타당한지 확인해 보고자 한다. K-평균 군집분석의 군집결과를 이용하여 판별분석을 수행한 R코드를 보여주는 화면은 아래와 같다.
판별분석 결과 화면이 길게 나타나는 관계로 여러 화면으로 분할 캡쳐하여 확인해 보고자 한다. 아래의 화면은 판별분석을 위하여 1단계로 데이터 읽기, 2단계로 판별분석을 실행한 결과화면이다.
아래의 화면은 판별분석을 위하여 3단계로 분류작업, 4단계로 분류표와 오분류율을 확인, 5단계로 변수선택 작업을 실행한 결과화면이다.
아래의 화면은 판별분석을 위하여 6단계로 변수선택 후 판별분석을 시행하고, 변수선택 전의 판별분석 결과와 분류표 및 오분류을 비교, 7단계로 분류함수를 구하고 분류함수 계수를 계산한 실행화면이다.
아래의 화면은 판별분석을 위하여 분류점수를 계산한 화면과, 8단계의 시각화를 위한 3가지 코드 실행화면이다.
분류점수 화면의 type1~type4에서 가장 수치가 높게 나온 타입(그룹)으로 판별분석 결과 분류되었음을 확인하는 화면이다. 이것을 K-평균 군집분석의 군집결과 비교하여 K-평균 군집분석의 타당성을 확인할 수 있다.
1행의 Amsterdam은 type1(198.6595)에서 가장 분류점수가 높으므로 type1로 분류된 것이며, K-평균 군집분석 결과에서도 type1로 군집되었다. 2행의 Athens는 type4(204.2866)에서 가장 분류점수가 높으므로 type4로 분류된 것이며, K-평균 군집분석 결과에서도 type4로 군집되었다. 3행의 Bogota는 type3(284.5567)에서 가장 분류점수가 높으므로 type3으로 분류된 것이며, K-평균 군집분석 결과에서도 type3으로 군집되었다. 4행의 Bombay는 type3(255.8958)에서 가장 분류점수가 높으므로 type3으로 분류된 것이며, K-평균 군집분석 결과에서도 type3으로 군집되었다. 5행의 Brussels는 type1(199.1357)에서 가장 분류점수가 높으므로 type1로 분류된 것이며, K-평균 군집분석 결과에서도 type1로 군집되었다. 6행의 Buenos Aires는 type4(236.4044)에서 가장 분류점수가 높으므로 type4로 분류된 것이며, K-평균 군집분석 결과에서도 type4로 군집되었다.
예를 들어 제시한 6가지 케이스를 포함하여 다른 모든 케이스에서도 판별분석 결과와 K-평균 군집분석 결과가 일치하는 것으로 나타나고 있으므로, K-평균 군집분석 결과는 타당하다고 인정할 수 있다.
  • 가격7,500
  • 페이지수28페이지
  • 등록일2019.07.29
  • 저작시기2019.6
  • 파일형식한글(hwp)
  • 자료번호#1107205
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니