목차
1. 통계와 인생
2. 숫자그룹
3. 분포스타일
4. 분포법칙
5. 견본으로 전체를 추정한다.
5. 견본으로 전체를 추정한다. (표준편차를 모르고 있을때)
7. 능력을 판정한다. (검정 이야기)
2. 숫자그룹
3. 분포스타일
4. 분포법칙
5. 견본으로 전체를 추정한다.
5. 견본으로 전체를 추정한다. (표준편차를 모르고 있을때)
7. 능력을 판정한다. (검정 이야기)
본문내용
이
-귀무가설이 옳은데도 불구하고 귀무가설을 기각하는 오류를 제 1종 오류라고 함.
-기각역의 크기를 작게 하면 제 1종 오류는 작아지나 제 2종 오류는 커지고, 기각역을 크게 하면 제 2종 오류는 작아지나 제 1종 오류가 커짐.
-따라서, 가설검정에서는 제 1종 오류 확률
alpha
의 크기를 0.1, 0.5, 0.01로 고정시킨 다음 제 2종 오류확률
beta
의 크기가 최소가 되도록 기각역을 설정함
가설 검정의 5단계
-단계1: 검정하고자 하는 목적에 따라서 귀무가설과 대립가설을 설정한다.
-단계2: 검정통계량을 구하고, 그 통계량의 분포를 구한다.
-단계3: 우의수준을 결정하고 검정통계량의 분포에서 가설의 형태에 따라 유의수준에 해당하는 기각역을 설정한다.
-단계4: 귀무가설이 옳다는 전제하에서 표본관찰에 의한 검정 통계량의 값을 구한다.
-단계5: 단계 4에서 구한 검정통계량의 값이 기각역에 속하는가를 판단하여 기각역에 속하면 귀무가설을 기각사고 기각역에 속하지 않으면 귀무가설을 채택한다.
가설검정은 왜 하는가?
-모집단에 대한 어떤 가설을 설정한 뒤에 표본관찰을 통하여 그 가설의 채택여부를 확률적으로 판정하는 통계적 추론의 한 방법.
가설검정 능력을 반드시 숙지하여야만 하는 이유
-자료를 분석하고자 하는 연구자는 자신이 분석하고자 하는 연구목적과 방법에 대하여 정확히 기술할 수 있어야 함. 즉 자신이 분석하고자 하는 것에 대한 가설을 기술할 능력을 가지고 있어야 함.
-만일, 통계적 지식이 없거나 연구를 처음 접해 보는 연구자가 자신의 연구를 통계전문가에게 의뢰를 할 경우, 통계전문가도 자신의 전문분야가 아니기 때문에, 의뢰자의 연구가 무엇을 하고자하는 것인지 이해하기 어려울 수 있음.
(4) 중량의 속임수를 발견한다.
C 베이커리에서 늘 식빵을 구입하던 승건이는 어느 날부터 식빵이 무게가 전보다 적어졌다는 느낌이 들었다. 분명 식빵의 포장용지에는 식빵의 무게 450g로 표시되어 있지만, 왠지 요즘의 C 베이커리 식빵은 그 보다 적게 나가는 것만 같았다. 승건이는 이를 조사하기 위해 일주일간 식빵의 무게를 측정하여 기록하여 다음과 같은 결과를 얻었다.
월
화
수
목
금
토
일
439
458
435
445
423
450
430
평균:440g
일주일간 식빵의 평균값을 계산해 보니, 440g이었다. 요즘 C베이커리의 식빵 무게는 450g보다 적은 것인지 아니면, 승건이는 매번 운이 나쁘게 무게가 적은 식빵만을 고른것인지 t-검정을 통해 알아보시오. (신뢰수준95%) -양측검정-
귀무가설: 식빵의 무게는 450g이다.
대립가설 : 식빵의 무게는 450g이 아니다.
표본표준편차
sqrt {{(439-440) ^{2} +(458-440) ^{2} +........+(430-440) ^{2}} over {7}} =
11.11
검정통계량 t =
{ bar { chi - mu } } over { { s } over { sqrt { n-1 } } }
=
{ 440-450 } over { { 11.11 } over { sqrt { 7-1 } } }
= -2.20
t-분포표에서
phi
= 7-1 = 6인 지점 ==> 2.447
(-2.20)이 기각역(-2.447)에 포함되지 않으므로 귀무가설을 기각할 수 없다.
따라서, 식빵의 무게는 450g이다.
(5) 중량이 적게 정해져 있다면
C 베이커리에서 늘 식빵을 구입하던 승건이는 어느 날부터 식빵이 무게가 전보다 적어졌다는 느낌이 들었다. 분명 식빵의 포장용지에는 식빵의 무게 450g로 표시되어 있지만, 왠지 요즘의 C 베이커리 식빵은 그 보다 적게 나가는 것만 같았다. 승건이는 이를 조사하기 위해 일주일간 식빵의 무게를 측정하여 기록하여 다음과 같은 결과를 얻었다.
월
화
수
목
금
토
일
439
458
435
445
423
450
430
평균:440g
일주일간 식빵의 평균값을 계산해 보니, 440g이었다. 요즘 C베이커리의 식빵 무게는 450g보다 적은 것인지 아니면, 승건이는 매번 운이 나쁘게 무게가 적은 식빵만을 고른것인지 t-검정을 통해 알아보시오. (신뢰수준95%) -양측검정-
귀무가설: 식빵의 무게는 450g이다.
대립가설 : 식빵의 무게는 450g이 아니다.
표본표준편차
sqrt {{(439-440) ^{2} +(458-440) ^{2} +........+(430-440) ^{2}} over {7}} =
11.11
검정통계량 t =
{ bar { chi - mu } } over { { s } over { sqrt { n-1 } } }
=
{ 440-450 } over { { 11.11 } over { sqrt { 7-1 } } }
= -2.20
따라서 식빵의 무게는 450g이 아니다.
(6) 오른손잡이는 오른손이 크다.
오른손
왼손
오른손과 왼손의 차
필자
212mm
208mm
4mm
처
194mm
188mm
6mm
딸
160mm
158mm
2mm
오른손잡이의 오른손이 더 큰지 어떤지를 검정하려면 4, 6, 2,의 3개 값이 0을 평균값으로 하는 정규분포에서 끄집어낸 것인지 어떤지를 검정하면 되는 것이다.
다시 말하면
mu
=0이라는 가설을 세워 4, 6, 2라는 플러스 쪽으로 기운 값만을 끄집어낼 확률이 5%보다 큰지 혹은 적은지를 판정하면 되는 것이다. 그리고 그 확률이 5%보다 적다면
mu
=0의 가설을 기각하고, '오른손잡이는 오른손이 크다'가 이긴 것이 된다.
t-분석
bar{chi } = {4+6+2} over {3} =4# s= sqrt {{(4-4) ^{2} +(6-4) ^{2} +(2-4) ^{2}} over {3}} =1.63# t= {4-0} over {{1.63} over {sqrt {3-1}}} =3.47
t분포표에서 n이 3인 곳을 살펴보면
n
phi
양쪽 끝의 면적
0.10
0.05
0.01
3
2
2.920
4.303
9.925
즉, 만일
mu
=0이라고 가정하면 4, 6, 2와 같은 플러스 값으로만 기운, 우연이 모일 확률은 5%보다 적다고 판정되었다.
3면만의 자료지만, '오른손잡이는 오른손이 크다' 라는 판정을 내려도 될 것 같다.
-귀무가설이 옳은데도 불구하고 귀무가설을 기각하는 오류를 제 1종 오류라고 함.
-기각역의 크기를 작게 하면 제 1종 오류는 작아지나 제 2종 오류는 커지고, 기각역을 크게 하면 제 2종 오류는 작아지나 제 1종 오류가 커짐.
-따라서, 가설검정에서는 제 1종 오류 확률
alpha
의 크기를 0.1, 0.5, 0.01로 고정시킨 다음 제 2종 오류확률
beta
의 크기가 최소가 되도록 기각역을 설정함
가설 검정의 5단계
-단계1: 검정하고자 하는 목적에 따라서 귀무가설과 대립가설을 설정한다.
-단계2: 검정통계량을 구하고, 그 통계량의 분포를 구한다.
-단계3: 우의수준을 결정하고 검정통계량의 분포에서 가설의 형태에 따라 유의수준에 해당하는 기각역을 설정한다.
-단계4: 귀무가설이 옳다는 전제하에서 표본관찰에 의한 검정 통계량의 값을 구한다.
-단계5: 단계 4에서 구한 검정통계량의 값이 기각역에 속하는가를 판단하여 기각역에 속하면 귀무가설을 기각사고 기각역에 속하지 않으면 귀무가설을 채택한다.
가설검정은 왜 하는가?
-모집단에 대한 어떤 가설을 설정한 뒤에 표본관찰을 통하여 그 가설의 채택여부를 확률적으로 판정하는 통계적 추론의 한 방법.
가설검정 능력을 반드시 숙지하여야만 하는 이유
-자료를 분석하고자 하는 연구자는 자신이 분석하고자 하는 연구목적과 방법에 대하여 정확히 기술할 수 있어야 함. 즉 자신이 분석하고자 하는 것에 대한 가설을 기술할 능력을 가지고 있어야 함.
-만일, 통계적 지식이 없거나 연구를 처음 접해 보는 연구자가 자신의 연구를 통계전문가에게 의뢰를 할 경우, 통계전문가도 자신의 전문분야가 아니기 때문에, 의뢰자의 연구가 무엇을 하고자하는 것인지 이해하기 어려울 수 있음.
(4) 중량의 속임수를 발견한다.
C 베이커리에서 늘 식빵을 구입하던 승건이는 어느 날부터 식빵이 무게가 전보다 적어졌다는 느낌이 들었다. 분명 식빵의 포장용지에는 식빵의 무게 450g로 표시되어 있지만, 왠지 요즘의 C 베이커리 식빵은 그 보다 적게 나가는 것만 같았다. 승건이는 이를 조사하기 위해 일주일간 식빵의 무게를 측정하여 기록하여 다음과 같은 결과를 얻었다.
월
화
수
목
금
토
일
439
458
435
445
423
450
430
평균:440g
일주일간 식빵의 평균값을 계산해 보니, 440g이었다. 요즘 C베이커리의 식빵 무게는 450g보다 적은 것인지 아니면, 승건이는 매번 운이 나쁘게 무게가 적은 식빵만을 고른것인지 t-검정을 통해 알아보시오. (신뢰수준95%) -양측검정-
귀무가설: 식빵의 무게는 450g이다.
대립가설 : 식빵의 무게는 450g이 아니다.
표본표준편차
sqrt {{(439-440) ^{2} +(458-440) ^{2} +........+(430-440) ^{2}} over {7}} =
11.11
검정통계량 t =
{ bar { chi - mu } } over { { s } over { sqrt { n-1 } } }
=
{ 440-450 } over { { 11.11 } over { sqrt { 7-1 } } }
= -2.20
t-분포표에서
phi
= 7-1 = 6인 지점 ==> 2.447
(-2.20)이 기각역(-2.447)에 포함되지 않으므로 귀무가설을 기각할 수 없다.
따라서, 식빵의 무게는 450g이다.
(5) 중량이 적게 정해져 있다면
C 베이커리에서 늘 식빵을 구입하던 승건이는 어느 날부터 식빵이 무게가 전보다 적어졌다는 느낌이 들었다. 분명 식빵의 포장용지에는 식빵의 무게 450g로 표시되어 있지만, 왠지 요즘의 C 베이커리 식빵은 그 보다 적게 나가는 것만 같았다. 승건이는 이를 조사하기 위해 일주일간 식빵의 무게를 측정하여 기록하여 다음과 같은 결과를 얻었다.
월
화
수
목
금
토
일
439
458
435
445
423
450
430
평균:440g
일주일간 식빵의 평균값을 계산해 보니, 440g이었다. 요즘 C베이커리의 식빵 무게는 450g보다 적은 것인지 아니면, 승건이는 매번 운이 나쁘게 무게가 적은 식빵만을 고른것인지 t-검정을 통해 알아보시오. (신뢰수준95%) -양측검정-
귀무가설: 식빵의 무게는 450g이다.
대립가설 : 식빵의 무게는 450g이 아니다.
표본표준편차
sqrt {{(439-440) ^{2} +(458-440) ^{2} +........+(430-440) ^{2}} over {7}} =
11.11
검정통계량 t =
{ bar { chi - mu } } over { { s } over { sqrt { n-1 } } }
=
{ 440-450 } over { { 11.11 } over { sqrt { 7-1 } } }
= -2.20
따라서 식빵의 무게는 450g이 아니다.
(6) 오른손잡이는 오른손이 크다.
오른손
왼손
오른손과 왼손의 차
필자
212mm
208mm
4mm
처
194mm
188mm
6mm
딸
160mm
158mm
2mm
오른손잡이의 오른손이 더 큰지 어떤지를 검정하려면 4, 6, 2,의 3개 값이 0을 평균값으로 하는 정규분포에서 끄집어낸 것인지 어떤지를 검정하면 되는 것이다.
다시 말하면
mu
=0이라는 가설을 세워 4, 6, 2라는 플러스 쪽으로 기운 값만을 끄집어낼 확률이 5%보다 큰지 혹은 적은지를 판정하면 되는 것이다. 그리고 그 확률이 5%보다 적다면
mu
=0의 가설을 기각하고, '오른손잡이는 오른손이 크다'가 이긴 것이 된다.
t-분석
bar{chi } = {4+6+2} over {3} =4# s= sqrt {{(4-4) ^{2} +(6-4) ^{2} +(2-4) ^{2}} over {3}} =1.63# t= {4-0} over {{1.63} over {sqrt {3-1}}} =3.47
t분포표에서 n이 3인 곳을 살펴보면
n
phi
양쪽 끝의 면적
0.10
0.05
0.01
3
2
2.920
4.303
9.925
즉, 만일
mu
=0이라고 가정하면 4, 6, 2와 같은 플러스 값으로만 기운, 우연이 모일 확률은 5%보다 적다고 판정되었다.
3면만의 자료지만, '오른손잡이는 오른손이 크다' 라는 판정을 내려도 될 것 같다.