목차
1. 기술통계분석이란?
2. 기술통계분석은 언제 사용하는가?
3. 기술통계분석의 해석은 어떻게 할 것인가?
4. 기술분석의 구체적인 예
5. 기술통계분석의 해석에서 주의할 점.
2. 기술통계분석은 언제 사용하는가?
3. 기술통계분석의 해석은 어떻게 할 것인가?
4. 기술분석의 구체적인 예
5. 기술통계분석의 해석에서 주의할 점.
본문내용
* 명목척도(nominal scale) → 최빈치(mode), 서열척도(ordinal scale) → 평균치(mean), 등간척도(interval scale) → 중앙치(median), 비율척도(ratio scale) → 평균치(mean).
이 밖에도 많이 사용되는 값으로는 최소값(minimum), 최대값(maximum), 변동범위(range)가 있으며 최소값과 최대값은 특정 질문에 해당하는 변수의 값이 가장 적은 빈도수와 가장 큰 빈도수를 말하며 가장 큰 빈도수와 가장 적은 빈도수 간의 차이를 변동범위라고 한다.
또 하나의 중요한 값으로는 표준편차를 들 수 있다. 표준편차(Standard Deviation : 간단히 SD.라고 쓰기도 함)는 평균값에서 어느 정도 떨어져 있는지를 알 수 있는 산포도 측정도구이다. 표준편차를 구하는 공식은 제곱편차의 루트값이다. 표준편차가 작을수록 평균값 주변에 몰려 있고 클수록 평균값에서 떨어져 있다. 또한 변수값의 단위가 커지면 표준편차도 커지게 된다.
4. 기술분석의 구체적인 예
논문의 예를 통해 평균값을 해석해 보면 다음과 같다.
<보기1>은 학력별로 ‘정치·경제적요인’, ‘사회적요인’ 및 ‘문화적 요인’의 평균값을 비교한 것이고 <보기2>는 차이검정(Anova)에서 평균과 표준편차가 제시된 것을 보여준다.
<보기1>
중졸이하
고졸
전문대졸
대졸
대학원졸
정치·경제적요인
3.2122
3.7143
3.2360
3.7666
3.2133
사회적요인
3.2433
4.1662
3.5544
4.1043
3.7767
문화적요인
3.2394
3.3589
3.6627
3.9823
3.3623
<보기1>에 제시된 내용을 살펴보면 성별 및 연령과 마찬가지로 학력에서도사회적 요인이 공무원들의 윤리관에 가장 큰 영향을 미치는 요인으로 나타났다. 다만 전문 대학 졸업자들 만이 문화적 요인에서 평균 3.6627로 가장 높게 나타났으나 사회적 요인의 평균 3.5544와 큰 차이를 보이지 않은 것으로 볼 때 이러한 차이는 의미 있는 차이로 보기는 어렵다. 또한 연령대별로 살펴보면, 정치·경제적 요인 및 문화적 요인에 대해서는 대졸자가, 사회적 요인에서는 고졸자가 가장 높은 평균값을 보이고 있는 것으로 나타났다.
5. 기술통계분석의 해석에서 주의할 점.
평균치, 중앙치, 최빈치는 집단의 성격과 특징을 알 수 있는 통계분석기법이다. 그러나 지나치게 크거나 지나치게 작은 변수값이 포함되어 있으면 평균치보다 중앙치를 구하는 것이 더 적절하다. 예를 들어 5명이 가지고 있는 돈이 각각 4,500원, 5,000원, 5,300원, 5,500원, 15000원이라고 하자, 이들이 가진 돈의 평균은 얼마인가? 계산해 보면 7,060이다. 이렇게 평균값이 크게 나온 이유는 15,000원이라고 하는 극단치가 있기 때문이다. 이런 경우는 중앙치 5,300원을 사용하는 것이 바람직하다. 그리고 최빈치는 복수의 최빈치가 발생 할 수 있기 때문에 일반적으로 잘 사용하지 않는다. 따라서 집단의 성격에 따라 사용해야 할 측정치를 잘 결정해야 한다.
이 밖에도 많이 사용되는 값으로는 최소값(minimum), 최대값(maximum), 변동범위(range)가 있으며 최소값과 최대값은 특정 질문에 해당하는 변수의 값이 가장 적은 빈도수와 가장 큰 빈도수를 말하며 가장 큰 빈도수와 가장 적은 빈도수 간의 차이를 변동범위라고 한다.
또 하나의 중요한 값으로는 표준편차를 들 수 있다. 표준편차(Standard Deviation : 간단히 SD.라고 쓰기도 함)는 평균값에서 어느 정도 떨어져 있는지를 알 수 있는 산포도 측정도구이다. 표준편차를 구하는 공식은 제곱편차의 루트값이다. 표준편차가 작을수록 평균값 주변에 몰려 있고 클수록 평균값에서 떨어져 있다. 또한 변수값의 단위가 커지면 표준편차도 커지게 된다.
4. 기술분석의 구체적인 예
논문의 예를 통해 평균값을 해석해 보면 다음과 같다.
<보기1>은 학력별로 ‘정치·경제적요인’, ‘사회적요인’ 및 ‘문화적 요인’의 평균값을 비교한 것이고 <보기2>는 차이검정(Anova)에서 평균과 표준편차가 제시된 것을 보여준다.
<보기1>
중졸이하
고졸
전문대졸
대졸
대학원졸
정치·경제적요인
3.2122
3.7143
3.2360
3.7666
3.2133
사회적요인
3.2433
4.1662
3.5544
4.1043
3.7767
문화적요인
3.2394
3.3589
3.6627
3.9823
3.3623
<보기1>에 제시된 내용을 살펴보면 성별 및 연령과 마찬가지로 학력에서도사회적 요인이 공무원들의 윤리관에 가장 큰 영향을 미치는 요인으로 나타났다. 다만 전문 대학 졸업자들 만이 문화적 요인에서 평균 3.6627로 가장 높게 나타났으나 사회적 요인의 평균 3.5544와 큰 차이를 보이지 않은 것으로 볼 때 이러한 차이는 의미 있는 차이로 보기는 어렵다. 또한 연령대별로 살펴보면, 정치·경제적 요인 및 문화적 요인에 대해서는 대졸자가, 사회적 요인에서는 고졸자가 가장 높은 평균값을 보이고 있는 것으로 나타났다.
5. 기술통계분석의 해석에서 주의할 점.
평균치, 중앙치, 최빈치는 집단의 성격과 특징을 알 수 있는 통계분석기법이다. 그러나 지나치게 크거나 지나치게 작은 변수값이 포함되어 있으면 평균치보다 중앙치를 구하는 것이 더 적절하다. 예를 들어 5명이 가지고 있는 돈이 각각 4,500원, 5,000원, 5,300원, 5,500원, 15000원이라고 하자, 이들이 가진 돈의 평균은 얼마인가? 계산해 보면 7,060이다. 이렇게 평균값이 크게 나온 이유는 15,000원이라고 하는 극단치가 있기 때문이다. 이런 경우는 중앙치 5,300원을 사용하는 것이 바람직하다. 그리고 최빈치는 복수의 최빈치가 발생 할 수 있기 때문에 일반적으로 잘 사용하지 않는다. 따라서 집단의 성격에 따라 사용해야 할 측정치를 잘 결정해야 한다.
소개글