목차
1. 통계학(statistics)이란?
2. 통계학의 영역
3. 통계학의 목적
4. 주요분석
5. 데이터수집
6. 척도의 속성
7. 척도의 종류
8. 통계치란
9. 단변량분석과 다변량분석
10. 집중경향
11. 변산성
12. 차이분석과 관계분석과의 연관성
13. 모집단과 표본
14. 모수치와 통계치
15. 두 가지 표집방법의 차이
16. 확률표집의 개념
17. 확률표집의 종류
18. 비확률표집의 종류
19. 표본의 현실적 추출방법
20. 표집오차와 비표집오차
21. 통계학의 추론절차
2. 통계학의 영역
3. 통계학의 목적
4. 주요분석
5. 데이터수집
6. 척도의 속성
7. 척도의 종류
8. 통계치란
9. 단변량분석과 다변량분석
10. 집중경향
11. 변산성
12. 차이분석과 관계분석과의 연관성
13. 모집단과 표본
14. 모수치와 통계치
15. 두 가지 표집방법의 차이
16. 확률표집의 개념
17. 확률표집의 종류
18. 비확률표집의 종류
19. 표본의 현실적 추출방법
20. 표집오차와 비표집오차
21. 통계학의 추론절차
본문내용
): 군집확률표집이란 먼저 군집으로 분류한 후에 군집을 확률적인 표본으로 뽑는 방법들이다. 예를 들어, 서울시의 각 동으로 일단 분류를 한 다음, 서울시의 성향을 잘 반영하는 세 개의 동을 표본 추출하여 그 동을 모두 조사하는 방법이다. 하지만 군집 내에 숫자가 많으면 표본의 수가 많아져서 각 군집에서 단순확률표집 또는 체계확률표집으로 다시 추출하는 방법을 쓰기도 한다.
층화확률표집(stratified random sampling): 층별로 나눈 후에 다시 단순확률표집하는 것이다. 세대별로 인터넷에 대한 의견조사를 하려고 할 때는 10대, 20대, 30대, 40대, 50대, 60대, 70대로 구분한 후에 그 안에서 단순확률표본을 추출하는 방법이다.
체계확률표집(systematic random sampling): 체계확률표집이란 순서에 따라서 확률적으로 뽑는 방법이다. 할인점에 하루에 약 2만 명이 들어온다면, 2만 명을 천으로 나누어 20번째의 사람마다 물어보면 된다는 것이다.
확률표집 방법들은 실제로는 모집단의 특성에 따라 혼용되어 사용한다.
18. 비확률표집의 종류
편의표집(convenience sampling): 가장 많이 쓰이는 방법으로 아무에게나 물어보는 것이다. 길거리에 있는 사람들이나 자기가 아는 사람에게 물어보는 방법이다. “다음의 대통령 후보로 누가 나올까요?”라는 질문은 아무에게나 물어보아도 거의 비슷한 결과가 나올 것이다. 이것은 편의표집으로 해도 별 문제가 없다. 그러나 “다음의 대통령 후보들 중에서 누가 당선될까요?”라는 질문은 편의표집으로 하지 않는다. 이것은 확률표집으로 물어보아야 한다.
판단추출법(judgment sampling, 판단표집): 유의표집(purpose sampling)이라고도 한다. 조사자가 주관적인 지식과 경험에 의해 모집단을 가장 잘 대표하고 여기는 표본을 주관적으로 선정하는 방법이다.
할당추출법(quota sampling, 할당표집): 조사목적과 밀접하게 관련되어 있는 조사 대상자의 연령이나 성별과 같은 변수값에 따라서 모집단을 부분집단으로 구분하고, 모집단의 부분집단별 구성비율과 표본의 부분집단별 구성비율이 유사하도록 표본을 선정하는 방법이다. 가령 어느 병원의 서비스 만족도를 조사하고자 한다면 기존의 자료에 의거하여 환자 연령별, 과별, 성별 비율을 알아본 다음 그 비율에 따라 표본을 연령별, 과별, 성별로 할당하는 방법이다. 일단 각 속성별로 표본의 크기가 정해지고 나면 조사원은 정해진 크기대로 표본을 선정하는데 동일한 속성 내에서 누구를 표본을 선택할 것이냐는 전적으로 조사원이 결정하도록 하는 방법이다. 할당추출은 비용이 적게 들고 손쉽기 때문에 단기간에 조사해야 하는 경우에 맞다. 하지만 경우에 따라서 심각한 오차가 발생할 수도 있다.
눈덩이 추출법(snowball sampling, 눈덩이표집): 접근이 곤란한 특정 집단(예를 들어, 매춘, 마약, 동성애)에 대한 조사에서 사용되는 방법이다. 먼저 해당 집단에 속하는 것으로 사전에 알고 있는 사람들을 대상으로 사람들을 소개받고 조사대상자를 점진적으로 확대해 나가는 방법이다. 문명한 표집틀이 없고, 최선의 표집선택의 방법이 개인적인 접촉을 통해서 얻어지는 곳에서 이용된다.
19. 표본의 현실적 추출방법
- 표집방법 중에서 현실적으로 가장 많이 쓰이는 것은 편의표집이다. 편의표집이 많이 쓰이는 이유는 확률표본을 써서 뽑는 것이 비용과 시간, 그리고 노력 면에서 상당한 노력이 소요되기 때문이다. 국가에서 시행하는 통계조사, 공직자를 뽑는 선거조사, 국가의 큰 정책에 영향을 주는 여론조사를 할 때는 당연히 확률표집을 사용한다. 그러나 그 이외의 조사 대부분은 편의표집을 쓴다.
통계학의 논리는 모집단의 특성과 별 상관없이도 표본을 어느 정도 뽑으면 모집단의 특성이 반영된다고 한다. 가장 핵심적인 개념은 대수의 법칙(law of large number)이다. 대수의 법칙이란 모집단에서 비교적 많은 표본을 뽑으면 표본특성은 모집단의 특성에 근접해 간다는 논리이다.
또 다른 논리는 통계학이란 “차이가 있느냐 없느냐”라는 차이분석과 “관계가 있느냐 없느냐”라는 관계분석이 핵심이다. 남자와 여자의 키 차이가 있느냐 없느냐라는 큰 것을 분석할 때는 세세한 사항은 별로 영향을 안 줄 수도 있다는 것이다.
현실적으로 모집단의 목록을 구하기 어렵고, 쉽게 조사가 가능한 편의표집을 사용하는 경우가 매우 많다. 대학이나 연구소의 거의 모든 조사는 편의표집을 쓰고 있다. 단, 표본의 정확도가 아주 민감한 조사의 경우(대통령 선거 같은)에는 확률표집을 써야 한다.
20. 표집오차와 비표집오차
- 통계적으로 오차(error)란 무엇인가? 오차란 진실한 값(true value)과 잘못 측정된 실제 값(actual value)의 차이이다. 통계적인 오차에는 계산 가능한 표집오차와 계산이 불가능한 비표집오차가 있다. 오차는 작으면 작을수록 좋다.
* 표집오차(sampling error)란 표본을 선출하는 것과 관련되어 나타나는 오차를 의미하고 확률표집으로 뽑을 때에만 계산 가능하다. 또한 표집오차는 표본의 크기가 작으면 커지고, 표본의 크기가 커지면 줄어든다.
* 비표집오차(nonsampling error)란 표본을 뽑는 방식과 상관없이 나타나는 오차이다. 비표집오차는 응답자의 의도적인 왜곡, 조사원의 무심한 태도, 무응답에 대한 조작적인 기입 등과 관련되어 있다. 비표본오차는 표본의 크기가 작으면 적고, 표본의 크기가 커지면 커진다. 천 명의 표본에서 뽑은 결과는 수백만 명에게 물어보는 것보다 당연히 표본오차는 크나, 반대로 비표본오차는 천 명에게서 물어보는 것보다 수백만 명에게 물어볼 때 더 커질 수가 있다.
21. 통계학의 추론절차
- 통계학의 추론절차는 크게 두 가지로 분류된다. 통계적 추론(statistical inference)과 가설검정(hypothesis testing)이다. 통계적 추론은 추정을 하는 것이고, 가설검정은 추론의 결과가 맞는 것인지를 검증하는 것이다. 이와 같은 절차들을 거쳐서 앞으로 표본의 결과가 모집단의 결과와 동일한지 아닌지를 검증해 볼 수 있다.
층화확률표집(stratified random sampling): 층별로 나눈 후에 다시 단순확률표집하는 것이다. 세대별로 인터넷에 대한 의견조사를 하려고 할 때는 10대, 20대, 30대, 40대, 50대, 60대, 70대로 구분한 후에 그 안에서 단순확률표본을 추출하는 방법이다.
체계확률표집(systematic random sampling): 체계확률표집이란 순서에 따라서 확률적으로 뽑는 방법이다. 할인점에 하루에 약 2만 명이 들어온다면, 2만 명을 천으로 나누어 20번째의 사람마다 물어보면 된다는 것이다.
확률표집 방법들은 실제로는 모집단의 특성에 따라 혼용되어 사용한다.
18. 비확률표집의 종류
편의표집(convenience sampling): 가장 많이 쓰이는 방법으로 아무에게나 물어보는 것이다. 길거리에 있는 사람들이나 자기가 아는 사람에게 물어보는 방법이다. “다음의 대통령 후보로 누가 나올까요?”라는 질문은 아무에게나 물어보아도 거의 비슷한 결과가 나올 것이다. 이것은 편의표집으로 해도 별 문제가 없다. 그러나 “다음의 대통령 후보들 중에서 누가 당선될까요?”라는 질문은 편의표집으로 하지 않는다. 이것은 확률표집으로 물어보아야 한다.
판단추출법(judgment sampling, 판단표집): 유의표집(purpose sampling)이라고도 한다. 조사자가 주관적인 지식과 경험에 의해 모집단을 가장 잘 대표하고 여기는 표본을 주관적으로 선정하는 방법이다.
할당추출법(quota sampling, 할당표집): 조사목적과 밀접하게 관련되어 있는 조사 대상자의 연령이나 성별과 같은 변수값에 따라서 모집단을 부분집단으로 구분하고, 모집단의 부분집단별 구성비율과 표본의 부분집단별 구성비율이 유사하도록 표본을 선정하는 방법이다. 가령 어느 병원의 서비스 만족도를 조사하고자 한다면 기존의 자료에 의거하여 환자 연령별, 과별, 성별 비율을 알아본 다음 그 비율에 따라 표본을 연령별, 과별, 성별로 할당하는 방법이다. 일단 각 속성별로 표본의 크기가 정해지고 나면 조사원은 정해진 크기대로 표본을 선정하는데 동일한 속성 내에서 누구를 표본을 선택할 것이냐는 전적으로 조사원이 결정하도록 하는 방법이다. 할당추출은 비용이 적게 들고 손쉽기 때문에 단기간에 조사해야 하는 경우에 맞다. 하지만 경우에 따라서 심각한 오차가 발생할 수도 있다.
눈덩이 추출법(snowball sampling, 눈덩이표집): 접근이 곤란한 특정 집단(예를 들어, 매춘, 마약, 동성애)에 대한 조사에서 사용되는 방법이다. 먼저 해당 집단에 속하는 것으로 사전에 알고 있는 사람들을 대상으로 사람들을 소개받고 조사대상자를 점진적으로 확대해 나가는 방법이다. 문명한 표집틀이 없고, 최선의 표집선택의 방법이 개인적인 접촉을 통해서 얻어지는 곳에서 이용된다.
19. 표본의 현실적 추출방법
- 표집방법 중에서 현실적으로 가장 많이 쓰이는 것은 편의표집이다. 편의표집이 많이 쓰이는 이유는 확률표본을 써서 뽑는 것이 비용과 시간, 그리고 노력 면에서 상당한 노력이 소요되기 때문이다. 국가에서 시행하는 통계조사, 공직자를 뽑는 선거조사, 국가의 큰 정책에 영향을 주는 여론조사를 할 때는 당연히 확률표집을 사용한다. 그러나 그 이외의 조사 대부분은 편의표집을 쓴다.
통계학의 논리는 모집단의 특성과 별 상관없이도 표본을 어느 정도 뽑으면 모집단의 특성이 반영된다고 한다. 가장 핵심적인 개념은 대수의 법칙(law of large number)이다. 대수의 법칙이란 모집단에서 비교적 많은 표본을 뽑으면 표본특성은 모집단의 특성에 근접해 간다는 논리이다.
또 다른 논리는 통계학이란 “차이가 있느냐 없느냐”라는 차이분석과 “관계가 있느냐 없느냐”라는 관계분석이 핵심이다. 남자와 여자의 키 차이가 있느냐 없느냐라는 큰 것을 분석할 때는 세세한 사항은 별로 영향을 안 줄 수도 있다는 것이다.
현실적으로 모집단의 목록을 구하기 어렵고, 쉽게 조사가 가능한 편의표집을 사용하는 경우가 매우 많다. 대학이나 연구소의 거의 모든 조사는 편의표집을 쓰고 있다. 단, 표본의 정확도가 아주 민감한 조사의 경우(대통령 선거 같은)에는 확률표집을 써야 한다.
20. 표집오차와 비표집오차
- 통계적으로 오차(error)란 무엇인가? 오차란 진실한 값(true value)과 잘못 측정된 실제 값(actual value)의 차이이다. 통계적인 오차에는 계산 가능한 표집오차와 계산이 불가능한 비표집오차가 있다. 오차는 작으면 작을수록 좋다.
* 표집오차(sampling error)란 표본을 선출하는 것과 관련되어 나타나는 오차를 의미하고 확률표집으로 뽑을 때에만 계산 가능하다. 또한 표집오차는 표본의 크기가 작으면 커지고, 표본의 크기가 커지면 줄어든다.
* 비표집오차(nonsampling error)란 표본을 뽑는 방식과 상관없이 나타나는 오차이다. 비표집오차는 응답자의 의도적인 왜곡, 조사원의 무심한 태도, 무응답에 대한 조작적인 기입 등과 관련되어 있다. 비표본오차는 표본의 크기가 작으면 적고, 표본의 크기가 커지면 커진다. 천 명의 표본에서 뽑은 결과는 수백만 명에게 물어보는 것보다 당연히 표본오차는 크나, 반대로 비표본오차는 천 명에게서 물어보는 것보다 수백만 명에게 물어볼 때 더 커질 수가 있다.
21. 통계학의 추론절차
- 통계학의 추론절차는 크게 두 가지로 분류된다. 통계적 추론(statistical inference)과 가설검정(hypothesis testing)이다. 통계적 추론은 추정을 하는 것이고, 가설검정은 추론의 결과가 맞는 것인지를 검증하는 것이다. 이와 같은 절차들을 거쳐서 앞으로 표본의 결과가 모집단의 결과와 동일한지 아닌지를 검증해 볼 수 있다.
추천자료
- [조사방법론] 통계와 가설검증에 대한 연구보고서
- “컴퓨터 통계처리와 통계패키지”에 대하여
- 확률과통계 요점정리
- 경원대학교 경영통계학 조민정 교수님 척도의종류 척도법 레포트
- [추리통계][추리통계 정의][추리통계 기본개념][추리통계 가설검증][추리통계 사례][추리통계...
- 통계교육(통계지도) 개념, 통계교육(통계지도) 목표와 필요성, 통계교육(통계지도) 경향과 과...
- [통계][추론][통계품질][통계자료][무응답조사자료][미니탭 통계프로그램]통계와 추정, 통계...
- 통계조사방법론과 설문지 작성법
- 통계조사방법론과 설문지 작성법
- [통계교육]통계교육(통계지도)의 가치, 통계교육(통계지도)의 기본방향, 통계교육(통계지도)...
- 컴퓨터통계처리와통계패키지 - 사조방
- [통계][통계 기본개념][통계 이론적 배경][통계 자료정리][통계 발전방안]통계의 의의, 통계...
- [생물통계학] Bioinformatics[생명,정보학]에 대해서
- [통계학] 명목척도, 서열척도, 등간척도, 비율척도 등 각 척도의 종류와 그 예
소개글