샘플링이론
본 자료는 6페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
해당 자료는 6페이지 까지만 미리보기를 제공합니다.
6페이지 이후부터 다운로드 후 확인할 수 있습니다.

목차

제 7장 계통추출

7.1 서론
7.2 계통표본 추출방법
7.3 모평균과 모집단 총합의 추정
7.4 모비율의 추정
7.5 표본크기의 결정
7.6 반복계통추출법
7.7 분산추정량의 문제

본문내용

1 2 0.562
2 6 2 2 1 0.844
3 3 2 9 7 2.681
4 0 2 5 6 1.219
표 7.6 표 7.4에서 계산된 연속적인 차이
표에서 오른쪽 행은 식 (7.27)에서 계산된
{hat {V}}_{d} ( {bar {y}}_{sy} )
이다.
이들 추정 분산은 단순임의 표본 추출에 의한 공식에서 구한 추정 값과 아주 가깝다. 그리고 참 분산
V( {bar {y}}_{sy} ) = 2.11
에 가깝게 놓여 있음을 알 수 있다.
표 7.5 의 순서화 된 정수 자료를 이동시키면 4개의 모든 가능한 계통 표본들에서 연속적인 차이는 (4, 4, 4, 4)가 된다. 이들 자료를 이용하면 가 계통 표본들에 대해 분산이
{hat {V}}_{d} ( {bar {y}}_{sy} ) = 1.20
된다. 여기서
{hat {V}}_{d} ( {bar{y}}_{sy} )
은 참 분산
V( {bar {y}}_{sy} ) = 1.25
에 아주 가깝다는 것을 알 수 있다. 또한 단순임의 표본 추출의 추정 값 (이 경우 6)은 좋게 나타나지 않는다.
모집단 원소들이 완전하게 무작위로 순서 화되지 않았다고 생각될 경우 연속적인 차이를 토대로 한 분산의 추정 값이 이용되어야 한다.
모집단의 원소들이 완전하게 무작위 순서로 나열되었다고 할 경우만 단순임의 표본추출에서 얻은 분산 추정 값을 이용해야 한다.
이러한 방법과 원칙은 비율 추정에도 적용된다.
예를 들면 표 7.4의 난수 자료가 각각 짝-홀수로 표시되었다고 하자. 여기서의 목적은 모 집단에 있는 짝수의 비율을 추정하는 것이다. 이 결과는 아래의 표 7.7에 나타나 있다.
집락의 수 1 0 0 1 0 0 1 1 0 0 1 1 1 0 0 0 1 1 1 0 p V(p) Vd(p)
1 1 0 0 1 1 0.6 0.045 0.047
2 0 0 0 0 1 0.2 0.030 0.023
3 0 1 1 0 1 0.6 0.045 0.070
4 1 1 1 0 0 0.6 0.045 0.023
(1=짝수)
표 7.7 짝-홀수의 난수
hat {V} ( hat {p} )
에 대한 계산은 단순임의 표본 추출을 이용한 것으로 식 (7.10)에서 구했고
{hat {V}}_{d} ( hat {p})
의 계산은 식 (7.72)에 의해 구하였다. 이 경우에 참 분산은
V({hat {p}}_{st}) = 0.30
이므로 두 경우 모두가 바람직하게 잘 수행되었다. 이 값들은 완전하게 무작위 순서로 나열된 난수에 대해서 예측될 수 있는 것이다.
표 7.8은 10보다 같거나 작으면 0으로 표시되고 10보다 크면 1로 표시하도록 한 표 7.5의 자료에 대한 계산을 나타낸 것이다.
집단의 수 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1
1 0 0 0 1 1 0.4 0.045 0.023
2 0 0 0 1 1 0.4 0.045 0.023
3 0 0 1 1 1 0.6 0.045 0.023
4 0 0 1 1 1 0.6 0.045 0.023
(0은 <10을 나타내고 1은 >10을 나타낸다)
표 7.8 순서화 된 정수 1-20
여기서의 목적은 모 집단에서 10보다 큰 정수의 비율을 추정하는 것이다. 이 경우 분산은
V({hat {p}}_{sy} ) = 0.10
이고 연속적인 차이를 토대로 한 분산 추정 값이 단순임의 표본 추출에 의한 분산 값보다 우위에 있음을 알 수 있다.
만약 모집단에 있는 자료가 무작위 순서로 나열되지 않은 경우에는 연속적인 차이를 이용하는 방법이 표본 비율의 분산 추정을 위해 이용될 수 있다.
다음의 두 예에서 더욱 실제적인 형태를 살펴보기로 하자.
[예제 7.7] 88개의 기상 관측소 관측 자료를 이용하여 날씨 등 기상변화 및 상태를 파악한다고 하자. 크기가 n=8 인 계통 표본 추출로 전지역의 1월 평균 강우량을 추정하고자 한다. 이 경우 k=11 이고 관측소 목록에서 처음 11개의 기상대 중에서 임의로 선택하는데 임의 출발점이 9이었다. 추출된 8개의 기상대에 대한 1월 강우량은 다음과 같다고 한다. (단위 : 인치)
0.5 1.8 1.9 4.7 1.7 0.7 1.7 2.8
88개의 모든 기상대에 대한 1월 평균 강우량을 추정하고 추정 오차의 한계를 계산하라.
풀이 식 (7.1)과 식 (7.2)를 이용하면
{bar {y}}_{sy} = 1.98 , { s}^{2 } = 1.728
이다.
그러므로 분산 추정 값은
hat {V} ( {bar {y}}_{sy} ) = { N-n} over {Nn } { s}^{ 2} = 0.196
이며 추정 오차의 한계는
2 SQRT { {hat{V}}({bar{y}}_{sy}}) } = 0.89
이다. 만약 측정값의 임의성에 의심이 가면 아래의 분산 추정 값을 이용하면 된다.
{hat {V}}_{d}({bar{y}}_{sy}} ) = { N-n} over {Nn } { 1} over {2(n-1) } SUM from { { i}=1} to n-1 { d}`_{i } ^{2 } = { 80} over {88(8)2(7) } (10554) = 0.176
그리고 추정 오차의 한계는 0.84 이다.
[예제 7.8] 낙동강에 하루에 방류되는 폐수 량을 살펴보고자 한다. 10일 간격으로 조사를 실시하여 3개월 동안 방류된 평균 폐수 량을 추정하기 위해 1과 10 사이에서 임의출발점 4를 선택하여 n=9개의 측정값을 다음과 같이 얻었다.
38 24 17 11 4.7 7.5 4.0 2.6 4.9
조사 기간동안에 매일 방류되는 평균 폐수 량을 추정하라.
풀이 식 (7.1)과 (7.2)로부터
{bar {y}}_{sy} = 12.63
hat V ({bar {y}}_{sy} ) = 14.018
이며 추정 오차의 한계는
2 SQRT { hat V ({bar{y}}_{sy}})} = 7.49
이다. 그리고 차의 분산 추정 값은
{ hat V}_{d} ( {bar y}_{sy} ) = 2.180
이며 추정 오차의 한계는 2.95이다.
이와 같이 차의 분산이 작은 추정 값을 가지는데 이는 표본 자료가 시간이 지나감에 따라 직선으로 감소하는 경향을 나타낼 경우이다.

키워드

  • 가격2,300
  • 페이지수18페이지
  • 등록일2002.11.21
  • 저작시기2002.11
  • 파일형식한글(hwp)
  • 자료번호#212724
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니