목차
없음
본문내용
수들의 속성으로부터 나온다. 분산분석은 실험설계에 의해 주로 사용되는 것으로 독립변수가 비정량적일 때 사용하고 회귀분석은 독립변수가 정량적일 때 사용한다. 그러나 회귀분석은 비정량적 변수를 가변수로 사용하여 해결할 수 있다. 일반적으로 회귀분석이 분산분석보다는 융통성있는 통계기법으로 받아 들여지는 이유는 ①분산분석은 단지 그룹간의 차이만을 나타내는 반면 회귀분석은 한걸음 더 나아가 이러한 차이를 야기하는 변수를 찾고 이들 변수의 영향을 분석할수 있다②변수가 비선형 일때도 회귀분석은 비선형회귀식이나 다중선형회귀식으로 나타낼 수 있으며③두 변수간의 상호작용을 처리하는데 있어서도 회귀분석이 분산분석보다 분산분석은 각 실험요소의 표본의 수가 같은 때에도 상호작용이 존재하지 않는다고 가정하여 주요인 효과의 분석으로부터 상호작용을 배제한다. 반면에 회귀분석에서는 상호작용을 변수로 회귀모형에 포함시켜 그 효과를 분석할수 있다④회귀분석은 자료의 일부를 분실하였을 때 이를 가변수를 이용하여 처리할수 있으며 비정량적 변수 또한 쉽게 처리할수 있다. *회귀분석과 판별분석: 둘 다 현상의 설명 및 예측 목적을 위해 이용되는 기법으로 분석의 목적이나 독립변수가 등간척도나 비율척도로 측정된다는 점은 같지만 종속변수가 명목척도라는 점에서 차이가 있다.
*판별분석과 군집분석의 차이점 군집분석과 판별분석의 차이점은 판별분석은 분석전에 각 대상들이 어떻게 집단으로 나누어졌는지 알려져 있어야 한다. 즉 집단이 이미 나누어져 있는 상태에서 그 집단의 특성을 연구하거나 어떠한 변수가 집단을 분류하는데 좋은가를 알아내려는 종속관계의 분석인 반면, 군집분석은 전체 대상들에 대한 상호관계를 파악하는데 초점을 두는 기법으로서 분류기준이 불명확할 경우에 이용되는 기법이다. 따라서 조사자가 연구 대상 집단의 분류기준을 모르고 있을 때에는 군집분석을 사용하여야 한다. 또한 군집분석을 통한 결과는 유사성이 높은 동질적인 군집을 나타내 주기는 하지만 그 특성을 설명해 주는 정보는 제공해 주지 못하고 통계적 유의수준도 나타내 주지 못한다. 현재까지 군집분석이 완벽하게 개발되었다고 볼 수 없으므로 군집분석을 사전분류의 기법으로서 대상들의 군집을 이루는 것을 목적으로 하고 판별분석기법을 사용하여 군집의 특성을 파악할 수 있다.
*Factor analysis vs. Regression, Cluster, MDS: Factor는 공통분산에 기초하는 관찰할 수 없는 선형결합에 의해 관찰할 수 있는 input variable을 설명하기 위한 시도이고, 반면 regression은 하나의 관찰할 수 있는 종속변수를 관찰할 수 있는 독립변수의 선형결합에 의해 설명하고자 하는 것이다. fator가 변수들의 internal structure를 밝히는 데 사용되는 반면, cluster의 목적은 전체적 유사성을 통해 그룹화하는 것이다. factor와 MDS는 둘 다 내재되어 있는 차원을 발견하고자 하는 시도에서는 유사하다. 그러나 fator는 input variable에 내재되어 있는 차원을 발견하고자 하는 반면, MDS는 objects사이의 유사성 또는 비유사성에 대한 측정치에 내재되어 있는 차원을 발견하는 데 그 목적이 있다.
다변량분산분석(MANOVA) 집단간의 종속변수에 대한 평균차이를 검증할 때 이용된다는 점에서는 분산분석과 동일한 점이 있으나 다음의 점들에서 차이가 있다. 다변량분산분석은 종속변수가 2개 이상일 때 종속변수간의 평균값의 차이를 검증하거나 독립변수의 변화에 대한 종속변수들을 종합한 값의 차이를 검증할 때 이용된다. 다변량분산분석에서는 종속변수군에서의 차이가 있음을 검증할 뿐만 아니라 종속변수군에서의 차이가 종속변수들 중에서 어느 변수에서 차이가 나는지도 검증할 수 있다. 또한 분산분석의 경우는 종속변수가 1개이지만 다변량분산분석은 종속변수가 다수일 때 이용된다는 점과 종속변수들 간의 상관관계를 고려한다는 점이다. 분산분석에서와 마찬가지로 독립변수는 다수가 될 수도 있으며 공분산분석에서처럼 통제변수를 도입할 수도 있다. 공분산분석을 포함하는 경우는 MANCOVA라고 한다. 다변량분산분석은 종속변수들간의 상호관계를 동시에 고려하여 분석을 하게 된다. 상호관계를 이용한다는 것은 다수의 변수를 한꺼번에 종속변수화 하기 위해서 각 변수의 독립된 확률분포를 이용하는 것이 아니라 다수의 변수들이 결합되어 나타나는 결합분포를 이용함을 의미한다. 변수들의 결합분포를 이용하기 위해서는 결합분포가 정규분포를 이루어야 한다. 또한 각 집단 내에서의 분산-공분산 메트릭스가 동일해야 한다.한편 종속변수들 간에 상관관계가 없으면 다변량분산분석을 할 필요성이 없을 것이다. 따라서 이에 대한 검증이 필요하다. 이에 대한 검증은 분산-공분산 메트릭스를 이용하게 된다.
다차원척도법(multidimensional scaling) 다차원척도법은 일차원의 개념으로 측정할 수 없는 개념을 측정할 때 사용하는 기법으로 대상들간의 유사성을 평가하게 하여 평가자가 대상을 평가하는데 내재하고 있는 평가기준을 발견하고, 각 기준에 따라 평가대상들이 갖는 측정치를 찾는 데 목적이 있다. 이러한 원리에 의하여 포지셔닝맵을 작성하는 데 다차원척도법을 주로 이용하고 있다. 이러한 다차원척도에 의한 분석은 측정대상이 되는 속성 이외에 다른 요인이 영향을 미치지 않는다는 가정이 필요하다.이러한 방법에는 입력자료를 계량적인 방식과 비계량적인 방식을 이용할 수 있다. 그러나 어느 방식을 이용하든지 많은 차이는 나지 않으므로 자료의 입수가 편한 것을 선택하게 된다. 자료는 평가대상들간의 유사성자료를 이용하고 유사성의 순위에 따라 평가대상들의 상대적인 거리가 계산되어 다차원공간에 평가대상의 좌표를 구하게 된다. 이 때 상대적인 거리의 정확도를 높이기 위해 다차원공간에서 반복적으로 평가대상의 위치를 정하게 된다 평가대상간의 상대적인 거리의 정확도는 스트레스 값을 통하여 알 수 있다. 이 값을 기준으로 적당한 차원의 수를 결정하게 된다. 차원의 수를 결정한 후에는 차원에 대한 해석을 하여야 한다. 차원의 해석은 전문가의 식견에 의하거나 회귀분석의 방법, 상관계수에 의한 분석방법이 있다.
*판별분석과 군집분석의 차이점 군집분석과 판별분석의 차이점은 판별분석은 분석전에 각 대상들이 어떻게 집단으로 나누어졌는지 알려져 있어야 한다. 즉 집단이 이미 나누어져 있는 상태에서 그 집단의 특성을 연구하거나 어떠한 변수가 집단을 분류하는데 좋은가를 알아내려는 종속관계의 분석인 반면, 군집분석은 전체 대상들에 대한 상호관계를 파악하는데 초점을 두는 기법으로서 분류기준이 불명확할 경우에 이용되는 기법이다. 따라서 조사자가 연구 대상 집단의 분류기준을 모르고 있을 때에는 군집분석을 사용하여야 한다. 또한 군집분석을 통한 결과는 유사성이 높은 동질적인 군집을 나타내 주기는 하지만 그 특성을 설명해 주는 정보는 제공해 주지 못하고 통계적 유의수준도 나타내 주지 못한다. 현재까지 군집분석이 완벽하게 개발되었다고 볼 수 없으므로 군집분석을 사전분류의 기법으로서 대상들의 군집을 이루는 것을 목적으로 하고 판별분석기법을 사용하여 군집의 특성을 파악할 수 있다.
*Factor analysis vs. Regression, Cluster, MDS: Factor는 공통분산에 기초하는 관찰할 수 없는 선형결합에 의해 관찰할 수 있는 input variable을 설명하기 위한 시도이고, 반면 regression은 하나의 관찰할 수 있는 종속변수를 관찰할 수 있는 독립변수의 선형결합에 의해 설명하고자 하는 것이다. fator가 변수들의 internal structure를 밝히는 데 사용되는 반면, cluster의 목적은 전체적 유사성을 통해 그룹화하는 것이다. factor와 MDS는 둘 다 내재되어 있는 차원을 발견하고자 하는 시도에서는 유사하다. 그러나 fator는 input variable에 내재되어 있는 차원을 발견하고자 하는 반면, MDS는 objects사이의 유사성 또는 비유사성에 대한 측정치에 내재되어 있는 차원을 발견하는 데 그 목적이 있다.
다변량분산분석(MANOVA) 집단간의 종속변수에 대한 평균차이를 검증할 때 이용된다는 점에서는 분산분석과 동일한 점이 있으나 다음의 점들에서 차이가 있다. 다변량분산분석은 종속변수가 2개 이상일 때 종속변수간의 평균값의 차이를 검증하거나 독립변수의 변화에 대한 종속변수들을 종합한 값의 차이를 검증할 때 이용된다. 다변량분산분석에서는 종속변수군에서의 차이가 있음을 검증할 뿐만 아니라 종속변수군에서의 차이가 종속변수들 중에서 어느 변수에서 차이가 나는지도 검증할 수 있다. 또한 분산분석의 경우는 종속변수가 1개이지만 다변량분산분석은 종속변수가 다수일 때 이용된다는 점과 종속변수들 간의 상관관계를 고려한다는 점이다. 분산분석에서와 마찬가지로 독립변수는 다수가 될 수도 있으며 공분산분석에서처럼 통제변수를 도입할 수도 있다. 공분산분석을 포함하는 경우는 MANCOVA라고 한다. 다변량분산분석은 종속변수들간의 상호관계를 동시에 고려하여 분석을 하게 된다. 상호관계를 이용한다는 것은 다수의 변수를 한꺼번에 종속변수화 하기 위해서 각 변수의 독립된 확률분포를 이용하는 것이 아니라 다수의 변수들이 결합되어 나타나는 결합분포를 이용함을 의미한다. 변수들의 결합분포를 이용하기 위해서는 결합분포가 정규분포를 이루어야 한다. 또한 각 집단 내에서의 분산-공분산 메트릭스가 동일해야 한다.한편 종속변수들 간에 상관관계가 없으면 다변량분산분석을 할 필요성이 없을 것이다. 따라서 이에 대한 검증이 필요하다. 이에 대한 검증은 분산-공분산 메트릭스를 이용하게 된다.
다차원척도법(multidimensional scaling) 다차원척도법은 일차원의 개념으로 측정할 수 없는 개념을 측정할 때 사용하는 기법으로 대상들간의 유사성을 평가하게 하여 평가자가 대상을 평가하는데 내재하고 있는 평가기준을 발견하고, 각 기준에 따라 평가대상들이 갖는 측정치를 찾는 데 목적이 있다. 이러한 원리에 의하여 포지셔닝맵을 작성하는 데 다차원척도법을 주로 이용하고 있다. 이러한 다차원척도에 의한 분석은 측정대상이 되는 속성 이외에 다른 요인이 영향을 미치지 않는다는 가정이 필요하다.이러한 방법에는 입력자료를 계량적인 방식과 비계량적인 방식을 이용할 수 있다. 그러나 어느 방식을 이용하든지 많은 차이는 나지 않으므로 자료의 입수가 편한 것을 선택하게 된다. 자료는 평가대상들간의 유사성자료를 이용하고 유사성의 순위에 따라 평가대상들의 상대적인 거리가 계산되어 다차원공간에 평가대상의 좌표를 구하게 된다. 이 때 상대적인 거리의 정확도를 높이기 위해 다차원공간에서 반복적으로 평가대상의 위치를 정하게 된다 평가대상간의 상대적인 거리의 정확도는 스트레스 값을 통하여 알 수 있다. 이 값을 기준으로 적당한 차원의 수를 결정하게 된다. 차원의 수를 결정한 후에는 차원에 대한 해석을 하여야 한다. 차원의 해석은 전문가의 식견에 의하거나 회귀분석의 방법, 상관계수에 의한 분석방법이 있다.
소개글