목차
1.표집
1.1 표집이란?
1.1.1 표집의 역사
1.1.2 모집단(population)과 표본(sample)의 개념
1.1.3 표집의 기본 개념
1.1.3.1 표집단위(Sampling unit)
1.1.3.2 관찰단위(Observation Unit)와 분석단위
(the Unit of Analysis)
1.1.3.3 표집틀(Sampling Frame)
1.1.3.4 통계치(Statistics)와 모수치(Parameters)
1.1.3.5 변수(Variable)
2. 표집의 종류
2.1. 확률적 표집방법(Probability Sampling Methods)
2.1.1 단순무선 표집방법(Simple Random Sampling)
2.1.2 체계적 무선 표집방법 (Systematic Random Sampling)
2.1.3 유층표집 (Stratified Sampling)
2.1.4 군집표집(Cluster Sampling)
2.1.5 다단계군집표집 (Multi-Stage Cluster Sampling)
2.2 비확률적 표집방법 (Non-Probability Sampling Methods)
2.2.1 가용표집(Available sampling)
2.2.2 자원자표집(Volunteer sampling)
2.2.3 의도적표집(Purposive Sampling)
2.2.4 할당표집 (Quota Sampling)
2.2.5 우연적 표집 (Accidental Sampling)
2.2.6 판단표집 (Judgement Sampling)
2.2.7 눈덩이표집(Snowball Sampling)
3. 표본의 기술(記述)
3.1 표집분포
3.1.1 이산분포
3.1.1.1 이항분포
3.1.1.2 기타 이산분포
3.1.2 연속분포
3.1.2.1 균일분포
3.1.2.2 편포 (Skewed Distribution)
3.1.2.3 정규분포(Normal distribution)
3.2 표본분포
3.2.1 평균의 표본분포
3.2.2 평균의 표준오차
3.2.3 평균의 표준 오차
3.2.4 평균의 표본분포의 특성
3.2.5 중앙집중한계의정리 (Central Limit Theorem)
3.2.6 많은 사례수의 법칙 (Law of Large Numbers)
3.2.7 신뢰수준과 신뢰구간(Confidence Level & Confidence Interval)
3.3 표집오차의 크기
3.4 표본의 크기
3.4.1 표본크기의 계산
3.5 가중치(Weight)
1.1 표집이란?
1.1.1 표집의 역사
1.1.2 모집단(population)과 표본(sample)의 개념
1.1.3 표집의 기본 개념
1.1.3.1 표집단위(Sampling unit)
1.1.3.2 관찰단위(Observation Unit)와 분석단위
(the Unit of Analysis)
1.1.3.3 표집틀(Sampling Frame)
1.1.3.4 통계치(Statistics)와 모수치(Parameters)
1.1.3.5 변수(Variable)
2. 표집의 종류
2.1. 확률적 표집방법(Probability Sampling Methods)
2.1.1 단순무선 표집방법(Simple Random Sampling)
2.1.2 체계적 무선 표집방법 (Systematic Random Sampling)
2.1.3 유층표집 (Stratified Sampling)
2.1.4 군집표집(Cluster Sampling)
2.1.5 다단계군집표집 (Multi-Stage Cluster Sampling)
2.2 비확률적 표집방법 (Non-Probability Sampling Methods)
2.2.1 가용표집(Available sampling)
2.2.2 자원자표집(Volunteer sampling)
2.2.3 의도적표집(Purposive Sampling)
2.2.4 할당표집 (Quota Sampling)
2.2.5 우연적 표집 (Accidental Sampling)
2.2.6 판단표집 (Judgement Sampling)
2.2.7 눈덩이표집(Snowball Sampling)
3. 표본의 기술(記述)
3.1 표집분포
3.1.1 이산분포
3.1.1.1 이항분포
3.1.1.2 기타 이산분포
3.1.2 연속분포
3.1.2.1 균일분포
3.1.2.2 편포 (Skewed Distribution)
3.1.2.3 정규분포(Normal distribution)
3.2 표본분포
3.2.1 평균의 표본분포
3.2.2 평균의 표준오차
3.2.3 평균의 표준 오차
3.2.4 평균의 표본분포의 특성
3.2.5 중앙집중한계의정리 (Central Limit Theorem)
3.2.6 많은 사례수의 법칙 (Law of Large Numbers)
3.2.7 신뢰수준과 신뢰구간(Confidence Level & Confidence Interval)
3.3 표집오차의 크기
3.4 표본의 크기
3.4.1 표본크기의 계산
3.5 가중치(Weight)
본문내용
1)연구의 형태 2)연구목적 3)연구의 복잡성 4)오차에 대한 허용정도 5)시간제약 6)재정 7)사전연구의 유뮤 이다.
)R D. Wimmer, J R.Dominick, Mass media Research 4th ed. (CA;Wadsworth,1994) p.75
표본의 크기를 정하는데 있어서 많을수록 바람직한 것은 사실이지만 표본의 크기를 단순히 늘리기보다는 표본의 크기가 적더라도 표본의 질을 높이는 것이 중요하다. 연구자가 표본의 크기를 정하는 데에는 원칙이 되는 것은 몇 가지가 있는데 이는 수학적인 근거가 있는 것은 아니지만 표본크기의 결정에 지침이 될 수 있다. 몇 가지를 살피면,
1) 표본크기의 결정에 우선적으로 고려할 것은 사용하는 통계적 방법이 어떤 것인가 하는 것이다.
2) 인구통계학적인 구분을 할 때에는 한 집단 당 100을 표본 수로 하는 것이 연구자들에게 많이 쓰인다. 예를 들어 18-54세의 성인들을 대상으로 하는 연구에서는 각 집단을 18-24세 25-34세 35-44세 45-54세로 나누고 각 집단의 표본 수를 100명 따라서 총 400명의 표본을 뽑는게 자주 이용되고 있다. 이때 만약 남녀를 구분한다면 각 집단이 총 8개의 Cell 이므로 800명을 표본의 수로 한다.
3) 표본의 크기는 언제나 시간과 비용의 제약을 받는다. 실제 1,000명의 표본 수를 얻는데는 $50.000이 넘기가 쉽다. 그러나 표본의 수를 1,000명에서 400으로 줄여도 표집오차가 크게 커지지 않는다.
4) 다변량 연구일 때는 일원적 연구일 때보다 많은 표본의 수를 요구한다.
5) 연구자가 조사하는 중에 표본의 탈락을 고려하여 실제 조사에 필요한 표본의 수보다는 여유있게 결정해야한다. 이러한 경우는 장기적인 연구나 패널연구일 때 더욱 필요하다.
6) 기존의 다른 연구에서 이용된 표본의 수를 참조하는 것이 필요하다.
7) 일반적으로 표본의 크기가 클수록 좋은 것은 사실이나 표본의 질을 고려해야한다.
3.4.1 표본크기의 계산
표본의 크기는 위에서 언급한 식을 통하여 산출할 수 있다.
신뢰수준 95%의 신뢰구간:
_p = p 1.96sqrt{{p(1-P)}over{n}}
을 n으로 정리하면,
n=p(1-p){(1.96)}^2over{( ■_p - p)}^2
예제) 어떠한 사전선거조사에서 A 후보가 60%의 지지를 얻고 있다고 조사되어졌고 95%의 신뢰수준에서 3%의 오차를 감안한다면 조사해야할 선거자의 수는?
n = ( .6times .4) 1.96^2 over 0.03^2 = 1024
따라서 최소 1,024명의 표본의 수가 필요하다.
하지만 많은 연구를 통하여 연구대상의 모집단이 크면 표본의 크기가 산술적으로 증가하여도 연구결과에 커다란 차이가 없다고 한다. 즉 신뢰구간 신뢰수준 모집단의 분산이 일정하면 모집단의 크기가 증가한다고 하여 같은 비율로 표본의 요구크기가 증가하지 않는다는 것이다.
김영석, 사회조사방법론 p.139 그림5-9는 이러한 예를 보여주는 것으로 모집단의 수가 2,000명일 때 약 400명의 표본의 수가 요구 되고 20,000명으로 모집단의 수가 증가하여도 약550명의의 표본수를 필요로하는 것으로 나타난다. (이 그림의 전제는 신뢰구간 95% 수준에서 3%의 오차허용과 p값이 50% 즉 어떠한 물음에 대답이 양분되는 경우 임)
) Nan Lin, Foundations of Social Research (McGraw-Hill, 1976) p.160
또한 모집단의 크기와 모분산이 일정할 경우 표본은 신뢰수준에 비하여 크게 잡아야 한다. 앞의책 p.140 그림 5-10을 보면 모집단이 20,000이고 모수치가 50%이고 신뢰수준이 95%이면 오차의 허용범위를 5%에서 1%로 증가시킨다면 표본의수를 377명에서 6,489명으로 증가시켜야 됨을 의미한다. 따라서 상당히 반분되어있는 (선거에서 두 후보간 지지율이 50%선일 때 등) 경우 정밀성을 높이기 위하여는 표본의 수를 많게 하여야 한다.
3.5 가중치(Weight)
가중치= 모집단에서의 점유율 / 표본에서의 점유율
모집단의 비율에 맞추어 표본을 선택하는 것이 바람직하나 그렇지 못할 경우는 가중치를 부여함으로서 해결할 수 있다.
예를들어 설문지연구에서 어떠한 집단(총집단 수 2,0000명)에 20대의 비율이 10%라고 하고 1000명의 설문지를 얻었다고 하면 이 표본의 20대의 수는 100명이 되어야 하나 되어야 설문지회수가 부족하는등의 이유로 90명뿐일 수가 있다.
이러한 경우에는 이러한 부족을 조정하기 위하여 가중치를 주는데 위의 예를 공식에 적용하면,
0.1/0.09=1.11이고 하나의 설문지는 200명이 아닌 222명(1.11*200)을 대표하게 되는 것이다. 이상적인 가중치는 물론 1.00이며 종종 표본의 수가 초과되어 가중치는 1이하일 경우가 발생하기도 한다.
) R D. Wimmer, J R.Dominick, Mass media Research 4th ed. (CA;Wadsworth,1994) p.75
참고문헌
Earl Babbie, the Practice of Social Research, 8th ed. (Wadsworth, 1988)
G.h.Stempel & B.H.Westley, eds, Research Methods in Mass Communication (NJ: PrenticeHall, 1981)
M.J Smith, Contemporary communication Research Methods (CA:Wadsworth,1988)
Nan Lin, Foundations of Social Research (McGraw-Hill, 1976)
R D. Wimmer, J R.Dominick, Mass media Research 4th ed. (CA;Wadsworth,1994)
김영석, 『사회조사방법론』 (서울: 나남, 1999)
박정식, 윤서일 『현대통계학』 (서울:다산출판사, 1997)
이용구, 『통계학원론』 (서울: 율곡출판사, 1992)
차배근, 『사회과학조사방법』全訂版 (서울: 세영사, 1990)
채서일, 『사회과학 조사방법론』 2판(서울: 학현사, 1995)
)R D. Wimmer, J R.Dominick, Mass media Research 4th ed. (CA;Wadsworth,1994) p.75
표본의 크기를 정하는데 있어서 많을수록 바람직한 것은 사실이지만 표본의 크기를 단순히 늘리기보다는 표본의 크기가 적더라도 표본의 질을 높이는 것이 중요하다. 연구자가 표본의 크기를 정하는 데에는 원칙이 되는 것은 몇 가지가 있는데 이는 수학적인 근거가 있는 것은 아니지만 표본크기의 결정에 지침이 될 수 있다. 몇 가지를 살피면,
1) 표본크기의 결정에 우선적으로 고려할 것은 사용하는 통계적 방법이 어떤 것인가 하는 것이다.
2) 인구통계학적인 구분을 할 때에는 한 집단 당 100을 표본 수로 하는 것이 연구자들에게 많이 쓰인다. 예를 들어 18-54세의 성인들을 대상으로 하는 연구에서는 각 집단을 18-24세 25-34세 35-44세 45-54세로 나누고 각 집단의 표본 수를 100명 따라서 총 400명의 표본을 뽑는게 자주 이용되고 있다. 이때 만약 남녀를 구분한다면 각 집단이 총 8개의 Cell 이므로 800명을 표본의 수로 한다.
3) 표본의 크기는 언제나 시간과 비용의 제약을 받는다. 실제 1,000명의 표본 수를 얻는데는 $50.000이 넘기가 쉽다. 그러나 표본의 수를 1,000명에서 400으로 줄여도 표집오차가 크게 커지지 않는다.
4) 다변량 연구일 때는 일원적 연구일 때보다 많은 표본의 수를 요구한다.
5) 연구자가 조사하는 중에 표본의 탈락을 고려하여 실제 조사에 필요한 표본의 수보다는 여유있게 결정해야한다. 이러한 경우는 장기적인 연구나 패널연구일 때 더욱 필요하다.
6) 기존의 다른 연구에서 이용된 표본의 수를 참조하는 것이 필요하다.
7) 일반적으로 표본의 크기가 클수록 좋은 것은 사실이나 표본의 질을 고려해야한다.
3.4.1 표본크기의 계산
표본의 크기는 위에서 언급한 식을 통하여 산출할 수 있다.
신뢰수준 95%의 신뢰구간:
_p = p 1.96sqrt{{p(1-P)}over{n}}
을 n으로 정리하면,
n=p(1-p){(1.96)}^2over{( ■_p - p)}^2
예제) 어떠한 사전선거조사에서 A 후보가 60%의 지지를 얻고 있다고 조사되어졌고 95%의 신뢰수준에서 3%의 오차를 감안한다면 조사해야할 선거자의 수는?
n = ( .6times .4) 1.96^2 over 0.03^2 = 1024
따라서 최소 1,024명의 표본의 수가 필요하다.
하지만 많은 연구를 통하여 연구대상의 모집단이 크면 표본의 크기가 산술적으로 증가하여도 연구결과에 커다란 차이가 없다고 한다. 즉 신뢰구간 신뢰수준 모집단의 분산이 일정하면 모집단의 크기가 증가한다고 하여 같은 비율로 표본의 요구크기가 증가하지 않는다는 것이다.
김영석, 사회조사방법론 p.139 그림5-9는 이러한 예를 보여주는 것으로 모집단의 수가 2,000명일 때 약 400명의 표본의 수가 요구 되고 20,000명으로 모집단의 수가 증가하여도 약550명의의 표본수를 필요로하는 것으로 나타난다. (이 그림의 전제는 신뢰구간 95% 수준에서 3%의 오차허용과 p값이 50% 즉 어떠한 물음에 대답이 양분되는 경우 임)
) Nan Lin, Foundations of Social Research (McGraw-Hill, 1976) p.160
또한 모집단의 크기와 모분산이 일정할 경우 표본은 신뢰수준에 비하여 크게 잡아야 한다. 앞의책 p.140 그림 5-10을 보면 모집단이 20,000이고 모수치가 50%이고 신뢰수준이 95%이면 오차의 허용범위를 5%에서 1%로 증가시킨다면 표본의수를 377명에서 6,489명으로 증가시켜야 됨을 의미한다. 따라서 상당히 반분되어있는 (선거에서 두 후보간 지지율이 50%선일 때 등) 경우 정밀성을 높이기 위하여는 표본의 수를 많게 하여야 한다.
3.5 가중치(Weight)
가중치= 모집단에서의 점유율 / 표본에서의 점유율
모집단의 비율에 맞추어 표본을 선택하는 것이 바람직하나 그렇지 못할 경우는 가중치를 부여함으로서 해결할 수 있다.
예를들어 설문지연구에서 어떠한 집단(총집단 수 2,0000명)에 20대의 비율이 10%라고 하고 1000명의 설문지를 얻었다고 하면 이 표본의 20대의 수는 100명이 되어야 하나 되어야 설문지회수가 부족하는등의 이유로 90명뿐일 수가 있다.
이러한 경우에는 이러한 부족을 조정하기 위하여 가중치를 주는데 위의 예를 공식에 적용하면,
0.1/0.09=1.11이고 하나의 설문지는 200명이 아닌 222명(1.11*200)을 대표하게 되는 것이다. 이상적인 가중치는 물론 1.00이며 종종 표본의 수가 초과되어 가중치는 1이하일 경우가 발생하기도 한다.
) R D. Wimmer, J R.Dominick, Mass media Research 4th ed. (CA;Wadsworth,1994) p.75
참고문헌
Earl Babbie, the Practice of Social Research, 8th ed. (Wadsworth, 1988)
G.h.Stempel & B.H.Westley, eds, Research Methods in Mass Communication (NJ: PrenticeHall, 1981)
M.J Smith, Contemporary communication Research Methods (CA:Wadsworth,1988)
Nan Lin, Foundations of Social Research (McGraw-Hill, 1976)
R D. Wimmer, J R.Dominick, Mass media Research 4th ed. (CA;Wadsworth,1994)
김영석, 『사회조사방법론』 (서울: 나남, 1999)
박정식, 윤서일 『현대통계학』 (서울:다산출판사, 1997)
이용구, 『통계학원론』 (서울: 율곡출판사, 1992)
차배근, 『사회과학조사방법』全訂版 (서울: 세영사, 1990)
채서일, 『사회과학 조사방법론』 2판(서울: 학현사, 1995)
소개글