목차
제 7장 계통추출
7.1 서론
7.2 계통표본 추출방법
7.3 모평균과 모집단 총합의 추정
7.4 모비율의 추정
7.5 표본크기의 결정
7.6 반복계통추출법
7.7 분산추정량의 문제
7.1 서론
7.2 계통표본 추출방법
7.3 모평균과 모집단 총합의 추정
7.4 모비율의 추정
7.5 표본크기의 결정
7.6 반복계통추출법
7.7 분산추정량의 문제
본문내용
1 2 0.562
2 6 2 2 1 0.844
3 3 2 9 7 2.681
4 0 2 5 6 1.219
표 7.6 표 7.4에서 계산된 연속적인 차이
표에서 오른쪽 행은 식 (7.27)에서 계산된
{hat {V}}_{d} ( {bar {y}}_{sy} )
이다.
이들 추정 분산은 단순임의 표본 추출에 의한 공식에서 구한 추정 값과 아주 가깝다. 그리고 참 분산
V( {bar {y}}_{sy} ) = 2.11
에 가깝게 놓여 있음을 알 수 있다.
표 7.5 의 순서화 된 정수 자료를 이동시키면 4개의 모든 가능한 계통 표본들에서 연속적인 차이는 (4, 4, 4, 4)가 된다. 이들 자료를 이용하면 가 계통 표본들에 대해 분산이
{hat {V}}_{d} ( {bar {y}}_{sy} ) = 1.20
된다. 여기서
{hat {V}}_{d} ( {bar{y}}_{sy} )
은 참 분산
V( {bar {y}}_{sy} ) = 1.25
에 아주 가깝다는 것을 알 수 있다. 또한 단순임의 표본 추출의 추정 값 (이 경우 6)은 좋게 나타나지 않는다.
모집단 원소들이 완전하게 무작위로 순서 화되지 않았다고 생각될 경우 연속적인 차이를 토대로 한 분산의 추정 값이 이용되어야 한다.
모집단의 원소들이 완전하게 무작위 순서로 나열되었다고 할 경우만 단순임의 표본추출에서 얻은 분산 추정 값을 이용해야 한다.
이러한 방법과 원칙은 비율 추정에도 적용된다.
예를 들면 표 7.4의 난수 자료가 각각 짝-홀수로 표시되었다고 하자. 여기서의 목적은 모 집단에 있는 짝수의 비율을 추정하는 것이다. 이 결과는 아래의 표 7.7에 나타나 있다.
집락의 수 1 0 0 1 0 0 1 1 0 0 1 1 1 0 0 0 1 1 1 0 p V(p) Vd(p)
1 1 0 0 1 1 0.6 0.045 0.047
2 0 0 0 0 1 0.2 0.030 0.023
3 0 1 1 0 1 0.6 0.045 0.070
4 1 1 1 0 0 0.6 0.045 0.023
(1=짝수)
표 7.7 짝-홀수의 난수
hat {V} ( hat {p} )
에 대한 계산은 단순임의 표본 추출을 이용한 것으로 식 (7.10)에서 구했고
{hat {V}}_{d} ( hat {p})
의 계산은 식 (7.72)에 의해 구하였다. 이 경우에 참 분산은
V({hat {p}}_{st}) = 0.30
이므로 두 경우 모두가 바람직하게 잘 수행되었다. 이 값들은 완전하게 무작위 순서로 나열된 난수에 대해서 예측될 수 있는 것이다.
표 7.8은 10보다 같거나 작으면 0으로 표시되고 10보다 크면 1로 표시하도록 한 표 7.5의 자료에 대한 계산을 나타낸 것이다.
집단의 수 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1
1 0 0 0 1 1 0.4 0.045 0.023
2 0 0 0 1 1 0.4 0.045 0.023
3 0 0 1 1 1 0.6 0.045 0.023
4 0 0 1 1 1 0.6 0.045 0.023
(0은 <10을 나타내고 1은 >10을 나타낸다)
표 7.8 순서화 된 정수 1-20
여기서의 목적은 모 집단에서 10보다 큰 정수의 비율을 추정하는 것이다. 이 경우 분산은
V({hat {p}}_{sy} ) = 0.10
이고 연속적인 차이를 토대로 한 분산 추정 값이 단순임의 표본 추출에 의한 분산 값보다 우위에 있음을 알 수 있다.
만약 모집단에 있는 자료가 무작위 순서로 나열되지 않은 경우에는 연속적인 차이를 이용하는 방법이 표본 비율의 분산 추정을 위해 이용될 수 있다.
다음의 두 예에서 더욱 실제적인 형태를 살펴보기로 하자.
[예제 7.7] 88개의 기상 관측소 관측 자료를 이용하여 날씨 등 기상변화 및 상태를 파악한다고 하자. 크기가 n=8 인 계통 표본 추출로 전지역의 1월 평균 강우량을 추정하고자 한다. 이 경우 k=11 이고 관측소 목록에서 처음 11개의 기상대 중에서 임의로 선택하는데 임의 출발점이 9이었다. 추출된 8개의 기상대에 대한 1월 강우량은 다음과 같다고 한다. (단위 : 인치)
0.5 1.8 1.9 4.7 1.7 0.7 1.7 2.8
88개의 모든 기상대에 대한 1월 평균 강우량을 추정하고 추정 오차의 한계를 계산하라.
풀이 식 (7.1)과 식 (7.2)를 이용하면
{bar {y}}_{sy} = 1.98 , { s}^{2 } = 1.728
이다.
그러므로 분산 추정 값은
hat {V} ( {bar {y}}_{sy} ) = { N-n} over {Nn } { s}^{ 2} = 0.196
이며 추정 오차의 한계는
2 SQRT { {hat{V}}({bar{y}}_{sy}}) } = 0.89
이다. 만약 측정값의 임의성에 의심이 가면 아래의 분산 추정 값을 이용하면 된다.
{hat {V}}_{d}({bar{y}}_{sy}} ) = { N-n} over {Nn } { 1} over {2(n-1) } SUM from { { i}=1} to n-1 { d}`_{i } ^{2 } = { 80} over {88(8)2(7) } (10554) = 0.176
그리고 추정 오차의 한계는 0.84 이다.
[예제 7.8] 낙동강에 하루에 방류되는 폐수 량을 살펴보고자 한다. 10일 간격으로 조사를 실시하여 3개월 동안 방류된 평균 폐수 량을 추정하기 위해 1과 10 사이에서 임의출발점 4를 선택하여 n=9개의 측정값을 다음과 같이 얻었다.
38 24 17 11 4.7 7.5 4.0 2.6 4.9
조사 기간동안에 매일 방류되는 평균 폐수 량을 추정하라.
풀이 식 (7.1)과 (7.2)로부터
{bar {y}}_{sy} = 12.63
hat V ({bar {y}}_{sy} ) = 14.018
이며 추정 오차의 한계는
2 SQRT { hat V ({bar{y}}_{sy}})} = 7.49
이다. 그리고 차의 분산 추정 값은
{ hat V}_{d} ( {bar y}_{sy} ) = 2.180
이며 추정 오차의 한계는 2.95이다.
이와 같이 차의 분산이 작은 추정 값을 가지는데 이는 표본 자료가 시간이 지나감에 따라 직선으로 감소하는 경향을 나타낼 경우이다.
2 6 2 2 1 0.844
3 3 2 9 7 2.681
4 0 2 5 6 1.219
표 7.6 표 7.4에서 계산된 연속적인 차이
표에서 오른쪽 행은 식 (7.27)에서 계산된
{hat {V}}_{d} ( {bar {y}}_{sy} )
이다.
이들 추정 분산은 단순임의 표본 추출에 의한 공식에서 구한 추정 값과 아주 가깝다. 그리고 참 분산
V( {bar {y}}_{sy} ) = 2.11
에 가깝게 놓여 있음을 알 수 있다.
표 7.5 의 순서화 된 정수 자료를 이동시키면 4개의 모든 가능한 계통 표본들에서 연속적인 차이는 (4, 4, 4, 4)가 된다. 이들 자료를 이용하면 가 계통 표본들에 대해 분산이
{hat {V}}_{d} ( {bar {y}}_{sy} ) = 1.20
된다. 여기서
{hat {V}}_{d} ( {bar{y}}_{sy} )
은 참 분산
V( {bar {y}}_{sy} ) = 1.25
에 아주 가깝다는 것을 알 수 있다. 또한 단순임의 표본 추출의 추정 값 (이 경우 6)은 좋게 나타나지 않는다.
모집단 원소들이 완전하게 무작위로 순서 화되지 않았다고 생각될 경우 연속적인 차이를 토대로 한 분산의 추정 값이 이용되어야 한다.
모집단의 원소들이 완전하게 무작위 순서로 나열되었다고 할 경우만 단순임의 표본추출에서 얻은 분산 추정 값을 이용해야 한다.
이러한 방법과 원칙은 비율 추정에도 적용된다.
예를 들면 표 7.4의 난수 자료가 각각 짝-홀수로 표시되었다고 하자. 여기서의 목적은 모 집단에 있는 짝수의 비율을 추정하는 것이다. 이 결과는 아래의 표 7.7에 나타나 있다.
집락의 수 1 0 0 1 0 0 1 1 0 0 1 1 1 0 0 0 1 1 1 0 p V(p) Vd(p)
1 1 0 0 1 1 0.6 0.045 0.047
2 0 0 0 0 1 0.2 0.030 0.023
3 0 1 1 0 1 0.6 0.045 0.070
4 1 1 1 0 0 0.6 0.045 0.023
(1=짝수)
표 7.7 짝-홀수의 난수
hat {V} ( hat {p} )
에 대한 계산은 단순임의 표본 추출을 이용한 것으로 식 (7.10)에서 구했고
{hat {V}}_{d} ( hat {p})
의 계산은 식 (7.72)에 의해 구하였다. 이 경우에 참 분산은
V({hat {p}}_{st}) = 0.30
이므로 두 경우 모두가 바람직하게 잘 수행되었다. 이 값들은 완전하게 무작위 순서로 나열된 난수에 대해서 예측될 수 있는 것이다.
표 7.8은 10보다 같거나 작으면 0으로 표시되고 10보다 크면 1로 표시하도록 한 표 7.5의 자료에 대한 계산을 나타낸 것이다.
집단의 수 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1
1 0 0 0 1 1 0.4 0.045 0.023
2 0 0 0 1 1 0.4 0.045 0.023
3 0 0 1 1 1 0.6 0.045 0.023
4 0 0 1 1 1 0.6 0.045 0.023
(0은 <10을 나타내고 1은 >10을 나타낸다)
표 7.8 순서화 된 정수 1-20
여기서의 목적은 모 집단에서 10보다 큰 정수의 비율을 추정하는 것이다. 이 경우 분산은
V({hat {p}}_{sy} ) = 0.10
이고 연속적인 차이를 토대로 한 분산 추정 값이 단순임의 표본 추출에 의한 분산 값보다 우위에 있음을 알 수 있다.
만약 모집단에 있는 자료가 무작위 순서로 나열되지 않은 경우에는 연속적인 차이를 이용하는 방법이 표본 비율의 분산 추정을 위해 이용될 수 있다.
다음의 두 예에서 더욱 실제적인 형태를 살펴보기로 하자.
[예제 7.7] 88개의 기상 관측소 관측 자료를 이용하여 날씨 등 기상변화 및 상태를 파악한다고 하자. 크기가 n=8 인 계통 표본 추출로 전지역의 1월 평균 강우량을 추정하고자 한다. 이 경우 k=11 이고 관측소 목록에서 처음 11개의 기상대 중에서 임의로 선택하는데 임의 출발점이 9이었다. 추출된 8개의 기상대에 대한 1월 강우량은 다음과 같다고 한다. (단위 : 인치)
0.5 1.8 1.9 4.7 1.7 0.7 1.7 2.8
88개의 모든 기상대에 대한 1월 평균 강우량을 추정하고 추정 오차의 한계를 계산하라.
풀이 식 (7.1)과 식 (7.2)를 이용하면
{bar {y}}_{sy} = 1.98 , { s}^{2 } = 1.728
이다.
그러므로 분산 추정 값은
hat {V} ( {bar {y}}_{sy} ) = { N-n} over {Nn } { s}^{ 2} = 0.196
이며 추정 오차의 한계는
2 SQRT { {hat{V}}({bar{y}}_{sy}}) } = 0.89
이다. 만약 측정값의 임의성에 의심이 가면 아래의 분산 추정 값을 이용하면 된다.
{hat {V}}_{d}({bar{y}}_{sy}} ) = { N-n} over {Nn } { 1} over {2(n-1) } SUM from { { i}=1} to n-1 { d}`_{i } ^{2 } = { 80} over {88(8)2(7) } (10554) = 0.176
그리고 추정 오차의 한계는 0.84 이다.
[예제 7.8] 낙동강에 하루에 방류되는 폐수 량을 살펴보고자 한다. 10일 간격으로 조사를 실시하여 3개월 동안 방류된 평균 폐수 량을 추정하기 위해 1과 10 사이에서 임의출발점 4를 선택하여 n=9개의 측정값을 다음과 같이 얻었다.
38 24 17 11 4.7 7.5 4.0 2.6 4.9
조사 기간동안에 매일 방류되는 평균 폐수 량을 추정하라.
풀이 식 (7.1)과 (7.2)로부터
{bar {y}}_{sy} = 12.63
hat V ({bar {y}}_{sy} ) = 14.018
이며 추정 오차의 한계는
2 SQRT { hat V ({bar{y}}_{sy}})} = 7.49
이다. 그리고 차의 분산 추정 값은
{ hat V}_{d} ( {bar y}_{sy} ) = 2.180
이며 추정 오차의 한계는 2.95이다.
이와 같이 차의 분산이 작은 추정 값을 가지는데 이는 표본 자료가 시간이 지나감에 따라 직선으로 감소하는 경향을 나타낼 경우이다.
추천자료
품질관리기사1차010603
품질관리기사1차0106
정부형태
[판별분석] 판별분석에 대하여
충남대 학우들의 성형수술에 대한 의식과 태도조사
현대통계학 9장 연습문제풀이 김우철 영지문화사
통계학 용어 정리
[통계학][통계]통계학의 의의, 통계학의 기본개념, 통계학의 자료유형, 통계학의 변인, 통계...
[통계][추론][통계품질][통계자료][무응답조사자료][미니탭 통계프로그램]통계와 추정, 통계...
GE의 HR 분야에 관한 사례 분석과 토론 내용에 대한 정리
[통계학]빈도분석 기술통계
국내증권시장분석
[마케팅조사론] 홈플러스 (Home plus) 삼성테스코(Tesco).PPT자료
[사회복지조사론] 사회복지 조사설계시 유형별을 요약하고 예를 들어 설명하시오 - 조사설계