목차
Ⅰ. 연구가설
(1) 영가설(零假設, null hypothesis, 歸無假設, 원가설)
(2) 대립가설대립가설(상대적 가설, alternative hypothesis : HA)
(3) 가설검증에서 통계적 오류
Ⅱ. 유의도와 자유도
(1) 유의도(significant level, 유의수준)
(2) 자유도(df : degree of freedom)
(1) 영가설(零假設, null hypothesis, 歸無假設, 원가설)
(2) 대립가설대립가설(상대적 가설, alternative hypothesis : HA)
(3) 가설검증에서 통계적 오류
Ⅱ. 유의도와 자유도
(1) 유의도(significant level, 유의수준)
(2) 자유도(df : degree of freedom)
본문내용
가설)이고 후자가 대립가설이다.
남녀 비율이 똑같은데 여섯 명 뽑아서 다 여자가 나올 확률은 1/64이다. 그렇기 때문에 열 명 다 뽑아서 다 여자가 나온다면 우리는 '설마 남녀 비율이 똑같은데 우연히 이렇게 나왔을까?'라고 생각하기보다는 '원래 남녀 비율이 다르겠지'라고 생각할 가능성이 높아진다. 전자가 맞을 확률은 1/64밖에 안 되기 때문이다.
여섯 명을 뽑는데 남자가 한 명만 나올 확률은 6/64이고 약 9%이다. 이 경우는 어떨까 전자와 후자 중 어느 쪽으로 생각하게 될까? 사람에 따라 다를 것이다.
문제에서 유의수준 5%로 검정하라, 또는 유의수준 1%로 검정하라 같은 말이 흔히 나온다. 이것은 주어진 조건이 일어날 확률이 5%(또는 1%) 이하라면 우연히 일어나기 힘든 일이라고 보고 원래 조건이 틀렸다고 간주하라는 뜻이다.
유의수준 10%로 검정하라고 하면 6명 중 남자가 1명일 경우라면 '우연히 일어나기 힘든 일'이므로 원래 남녀 비율이 1:1이 아니라고 생각하라는 뜻이다. 그러나 5%로라고 한다면 우연히 그럴 수도 있다고 보기 때문에 남녀 비율이 1:1이라는 가정이 틀렸다고 말할 수 없는 것이다.
그러므로 가설을 기각하지 않고 수용한다고 해도 이 가설을 수용한 것 자체가 잘못된 결정일 수도 있는 것이다. 다만 우리는 이렇게 유의수준을 낮게 하는 것은 좀더 보수적인 결론을 내리라는 뜻이다. 즉 신약 개발을 할 때 유의수준을 작게 하면 문제를 줄일 수 있다. 즉 신약을 투여해서 효과를 본 환자의 수가 기존 약을 투여한 환자보다 많은 것이 우연한 것인가 아니면 신약이 기존 약보다 좋아서인가 결론을 내릴 때, 실제론 신약이 효과가 좋은데 '우연히 신약을 투여하여 효과를 본 환자의 수가 기존 약을 투여한 환자보다 많다'고 잘못 생각하는 경우가 실제로 신약이 기존 약보다 나을 게 없는데 우연히 신약 투여로 효과를 본 환자가 많아서 '신약이 기존 약보다 낫다'고 잘못 생각하는 경우보다는 덜 위험하기 때문이다.
이 유의수준은 1종 오류를 범할 확률하고 똑같다. 1종 오류란 차이가 없는 것을 차이가 있다고 잘못 생각하는 것이다. 그 반대가 2종 오류다. 2종 오류는 차이가 있는 것을 차이가 없다고 잘못 생각하는 것이다. 1종 오류는 우리가 정하기 나름인데 1종 오류 확률이 낮으면 2종 오류를 범할 확률이 높아진다.
2. 자유도(df : degree of freedom)
주어진 조건하에서 자유로이 변화할 수 있는 점수나 변인의 수(N-1)
예를 들면 합이 100이라고 했을 때 사례 수가 5개라면 4개 사례의 수가 정해지면 나머지 하나의 사례 수는 자동으로 정해진다. 따라서 자유도는 5-1= 4이다. 3개의 수를 합하여 10이 된다고 할 때 2개의 수가 정해지면 나머지 하나의 수는 정해진다. 즉 나머지 하나의 수는 자유가 없고 나머지 하나를 뺀 2개의 수는 자유로울 수 있다. 따라서 이 경우 자유도는 3-1=2가 된다.
t-test 검증법 : 집단내의 자유도 n(사례수)-1
ANOVA 검증법 : 집단간의 자유도 g(집단)-1
남녀 비율이 똑같은데 여섯 명 뽑아서 다 여자가 나올 확률은 1/64이다. 그렇기 때문에 열 명 다 뽑아서 다 여자가 나온다면 우리는 '설마 남녀 비율이 똑같은데 우연히 이렇게 나왔을까?'라고 생각하기보다는 '원래 남녀 비율이 다르겠지'라고 생각할 가능성이 높아진다. 전자가 맞을 확률은 1/64밖에 안 되기 때문이다.
여섯 명을 뽑는데 남자가 한 명만 나올 확률은 6/64이고 약 9%이다. 이 경우는 어떨까 전자와 후자 중 어느 쪽으로 생각하게 될까? 사람에 따라 다를 것이다.
문제에서 유의수준 5%로 검정하라, 또는 유의수준 1%로 검정하라 같은 말이 흔히 나온다. 이것은 주어진 조건이 일어날 확률이 5%(또는 1%) 이하라면 우연히 일어나기 힘든 일이라고 보고 원래 조건이 틀렸다고 간주하라는 뜻이다.
유의수준 10%로 검정하라고 하면 6명 중 남자가 1명일 경우라면 '우연히 일어나기 힘든 일'이므로 원래 남녀 비율이 1:1이 아니라고 생각하라는 뜻이다. 그러나 5%로라고 한다면 우연히 그럴 수도 있다고 보기 때문에 남녀 비율이 1:1이라는 가정이 틀렸다고 말할 수 없는 것이다.
그러므로 가설을 기각하지 않고 수용한다고 해도 이 가설을 수용한 것 자체가 잘못된 결정일 수도 있는 것이다. 다만 우리는 이렇게 유의수준을 낮게 하는 것은 좀더 보수적인 결론을 내리라는 뜻이다. 즉 신약 개발을 할 때 유의수준을 작게 하면 문제를 줄일 수 있다. 즉 신약을 투여해서 효과를 본 환자의 수가 기존 약을 투여한 환자보다 많은 것이 우연한 것인가 아니면 신약이 기존 약보다 좋아서인가 결론을 내릴 때, 실제론 신약이 효과가 좋은데 '우연히 신약을 투여하여 효과를 본 환자의 수가 기존 약을 투여한 환자보다 많다'고 잘못 생각하는 경우가 실제로 신약이 기존 약보다 나을 게 없는데 우연히 신약 투여로 효과를 본 환자가 많아서 '신약이 기존 약보다 낫다'고 잘못 생각하는 경우보다는 덜 위험하기 때문이다.
이 유의수준은 1종 오류를 범할 확률하고 똑같다. 1종 오류란 차이가 없는 것을 차이가 있다고 잘못 생각하는 것이다. 그 반대가 2종 오류다. 2종 오류는 차이가 있는 것을 차이가 없다고 잘못 생각하는 것이다. 1종 오류는 우리가 정하기 나름인데 1종 오류 확률이 낮으면 2종 오류를 범할 확률이 높아진다.
2. 자유도(df : degree of freedom)
주어진 조건하에서 자유로이 변화할 수 있는 점수나 변인의 수(N-1)
예를 들면 합이 100이라고 했을 때 사례 수가 5개라면 4개 사례의 수가 정해지면 나머지 하나의 사례 수는 자동으로 정해진다. 따라서 자유도는 5-1= 4이다. 3개의 수를 합하여 10이 된다고 할 때 2개의 수가 정해지면 나머지 하나의 수는 정해진다. 즉 나머지 하나의 수는 자유가 없고 나머지 하나를 뺀 2개의 수는 자유로울 수 있다. 따라서 이 경우 자유도는 3-1=2가 된다.
t-test 검증법 : 집단내의 자유도 n(사례수)-1
ANOVA 검증법 : 집단간의 자유도 g(집단)-1
추천자료
청소년기 반발심과 문제행동
합리적 선택이론과 외교정책
교육 경영과 교육 행정의 차이점
대학생들의 대인관계에 대한 적극성과 성별이 휴대폰중독에 미치는 영향
[금융시장]한국의 지역금융이 지역경제에 미치는 효과 및 방향
[디지털][디지털시대][디지털문화][디지털경제][디지털컨텐츠][디지털산업]디지털시대의 디지...
[기업인수]외국기업의 국내기업 인수동기에 영향을 주는 요인
근대의 서막 : 프랑스 대혁명
[A+] 중국인 관광객의 시장세분화를 통한 관광상품 개발방안 - 제주도 관광, 제주도 중국인관...
[사회복지조사론] 대중매체와 청소년 성비행의 관계
분산 분석
봉사활동 경험여부에 따른 사회복지전공 대학생들의 장애인식 및 태도조사
[교육심리학 공통] 1. 가드너(Gardner)의 다중지능이론을 설명하고 그 교육적 시사점을 논하...
소개글