목차
1. 통계학
2. 통계학의 분류
3. 통계학의 내용
제 2 장 자료의 처리 방법과 표현
2. 통계학의 분류
3. 통계학의 내용
제 2 장 자료의 처리 방법과 표현
본문내용
값들이 퍼져있는 정도를 산포도(dispersion)라 하며, 이러한 산포도를 측정하는 방법으로는 분산, 표준편차, 범위, 사분위범위 등이 있다.
분산(Variance)
분산(variance)은 평균을 중심으로 자료의 흩어진 정도가 어느 정도인지를 측정.
모집단에서 분산을 모분산(population variance)이라 하고 표본에서 분산을 표본분산(sample variance).
일반적으로 모집단의 크기를 , 모평균을 , 모분산을 라하고 표본의 크기를 , 표본평균을 로 표본분산을 라고 할 때, 모분산과 표본분산은 다음과 같이 표현.
분산은 자료에 대한 단위가 제곱형태로 구해지므로 자료의 설명에 있어 까다로운 경우가 있다. 예를 들어 자료에 대한 단위가 그램()이라면 분산은 그램의 제곱()형태로 설명하기 까다롭다. 따라서 분산은 단위가 없는 상대적으로 퍼진정도에 대한 크기를 나타낼 뿐임.
표준편차(Standard Deviation)
자료와 같은 단위를 갖는 흩어진 정도를 구하기 위해 분산에 양의 제곱근을 취한 것이 모표준편차(population standard deviation)와 표본표준편차(sample standard deviation).
일반적으로 모표준편차와 표본표준편차는 다음과 같이 표현.
범위(Range)
범위(range)는 전체 자료의 최대값과 최소값의 차이.
범위는 자료의 퍼짐을 나타내지만 평균과 마찬가지로 자료에 이상값이 존재하는 경우에 크게 영향을 받는 단점.
범위 = 자료의 최대값 - 자료의 최소값
(3) 분포의 형태를 나타내는 측도
분포의 형태를 나타내는 측도로 왜도, 첨도가 사용.
왜도(Skewness)
왜도란 자료의 분포모양이 어떻게 치우쳐 있는지를 나타내는 척도.
왜도의 값이 0면 집단의 분포가 대칭꼴.
왜도의 값이 0보다 크면 자료의 분포모양이 좌측으로 치우쳤다는 것을 의미한다. 이때 분포모양은 좌측으로 긴 꼬리 모양을 나타낸다.
왜도의 값이 0보다 작으면 자료의 분포모양이 우측으로 치우쳤다는 것을 의미한다. 이때 분포모양은 우측으로 긴 꼬리 모양을 나타낸다.
일반적으로 왜도는 다음과 같이 표현.
,좌우대칭
, 좌측으로 긴 꼬리
, 우측으로 긴 꼬리
첨도(Kurtosis)
첨도란 자료의 분포모양이 중간위치에서 뾰족한 정도를 나타내는 척도.
첨도의 값은 뾰족할수록 크다.
첨도의 값이 0면 집단의 분포가 표준정규분포와 뾰족한 정도이다. 첨도의 값이 0보다 크면 표준정규분포보다 뾰족한 정도를 의미한다. 또한 첨도의 값이 0보다 작으면 표준정규분포보다 납작한 정도를 의미한다.
일반적으로 첨도는 다음과 같이 표현.
,표준정규분포와 뾰족한 정도가 같다.
, 표준정규분포보다 납작하다.
, 표준정규분포보다 뾰족하다.
(4) 상대적 위치의 측도
앞에서 다룬 중심위치 측도나 산포 만을 가지고는 어떤 특정한 자료값이 주어진 자료의 어떤 위치에 있는지를 알 수 없다.
상대적 위치의 측도는 특정값이 주어진 자료가 어떤 위치에 있는지 알 수 있다.
상대적 위치의 측도에는 백분위수, z값 등이 있다.
분산(Variance)
분산(variance)은 평균을 중심으로 자료의 흩어진 정도가 어느 정도인지를 측정.
모집단에서 분산을 모분산(population variance)이라 하고 표본에서 분산을 표본분산(sample variance).
일반적으로 모집단의 크기를 , 모평균을 , 모분산을 라하고 표본의 크기를 , 표본평균을 로 표본분산을 라고 할 때, 모분산과 표본분산은 다음과 같이 표현.
분산은 자료에 대한 단위가 제곱형태로 구해지므로 자료의 설명에 있어 까다로운 경우가 있다. 예를 들어 자료에 대한 단위가 그램()이라면 분산은 그램의 제곱()형태로 설명하기 까다롭다. 따라서 분산은 단위가 없는 상대적으로 퍼진정도에 대한 크기를 나타낼 뿐임.
표준편차(Standard Deviation)
자료와 같은 단위를 갖는 흩어진 정도를 구하기 위해 분산에 양의 제곱근을 취한 것이 모표준편차(population standard deviation)와 표본표준편차(sample standard deviation).
일반적으로 모표준편차와 표본표준편차는 다음과 같이 표현.
범위(Range)
범위(range)는 전체 자료의 최대값과 최소값의 차이.
범위는 자료의 퍼짐을 나타내지만 평균과 마찬가지로 자료에 이상값이 존재하는 경우에 크게 영향을 받는 단점.
범위 = 자료의 최대값 - 자료의 최소값
(3) 분포의 형태를 나타내는 측도
분포의 형태를 나타내는 측도로 왜도, 첨도가 사용.
왜도(Skewness)
왜도란 자료의 분포모양이 어떻게 치우쳐 있는지를 나타내는 척도.
왜도의 값이 0면 집단의 분포가 대칭꼴.
왜도의 값이 0보다 크면 자료의 분포모양이 좌측으로 치우쳤다는 것을 의미한다. 이때 분포모양은 좌측으로 긴 꼬리 모양을 나타낸다.
왜도의 값이 0보다 작으면 자료의 분포모양이 우측으로 치우쳤다는 것을 의미한다. 이때 분포모양은 우측으로 긴 꼬리 모양을 나타낸다.
일반적으로 왜도는 다음과 같이 표현.
,좌우대칭
, 좌측으로 긴 꼬리
, 우측으로 긴 꼬리
첨도(Kurtosis)
첨도란 자료의 분포모양이 중간위치에서 뾰족한 정도를 나타내는 척도.
첨도의 값은 뾰족할수록 크다.
첨도의 값이 0면 집단의 분포가 표준정규분포와 뾰족한 정도이다. 첨도의 값이 0보다 크면 표준정규분포보다 뾰족한 정도를 의미한다. 또한 첨도의 값이 0보다 작으면 표준정규분포보다 납작한 정도를 의미한다.
일반적으로 첨도는 다음과 같이 표현.
,표준정규분포와 뾰족한 정도가 같다.
, 표준정규분포보다 납작하다.
, 표준정규분포보다 뾰족하다.
(4) 상대적 위치의 측도
앞에서 다룬 중심위치 측도나 산포 만을 가지고는 어떤 특정한 자료값이 주어진 자료의 어떤 위치에 있는지를 알 수 없다.
상대적 위치의 측도는 특정값이 주어진 자료가 어떤 위치에 있는지 알 수 있다.
상대적 위치의 측도에는 백분위수, z값 등이 있다.