목차
Ⅰ. 개요
Ⅱ. 통계의 개념
Ⅲ. 통계와 직업
1. 주요업무
2. 적성․능력
3. 교육․훈련
4. 자격․면허
5. 취업전망
Ⅳ. 통계와 계량행정학
1. 객관적 합리적 행정
2. 민주적인 행정의 확립
3. 실증주의적 방법에 의한 정보의 생산과 그 이해
4. 전문관리인의 양성을 위한 훈련의 필수적인 분야
Ⅴ. 통계와 무응답자료처리모형
1. 무응답자료의 단순활용법
1) 유효자료분석법
2) 일반선형모형법
2. 무응답모형에 의한 방법
3. 삽입법
Ⅵ. 통계와 통계적연구조사방법
1. 비례배분법(Proportional allocation)
1) 정의
2) 정리 1
3) 정리 2
4) 정리 3
5) 정리 4
2. 최적배분법(Optimum allocation)
1) 정의 1
2) 정의 2
3) 정리 3
3. Neyman 배분법(Neyman allocation)
4. 데밍 배분법(Deming allovation)
Ⅶ. 통계와 통계프로그램(통계패키지)
참고문헌
Ⅱ. 통계의 개념
Ⅲ. 통계와 직업
1. 주요업무
2. 적성․능력
3. 교육․훈련
4. 자격․면허
5. 취업전망
Ⅳ. 통계와 계량행정학
1. 객관적 합리적 행정
2. 민주적인 행정의 확립
3. 실증주의적 방법에 의한 정보의 생산과 그 이해
4. 전문관리인의 양성을 위한 훈련의 필수적인 분야
Ⅴ. 통계와 무응답자료처리모형
1. 무응답자료의 단순활용법
1) 유효자료분석법
2) 일반선형모형법
2. 무응답모형에 의한 방법
3. 삽입법
Ⅵ. 통계와 통계적연구조사방법
1. 비례배분법(Proportional allocation)
1) 정의
2) 정리 1
3) 정리 2
4) 정리 3
5) 정리 4
2. 최적배분법(Optimum allocation)
1) 정의 1
2) 정의 2
3) 정리 3
3. Neyman 배분법(Neyman allocation)
4. 데밍 배분법(Deming allovation)
Ⅶ. 통계와 통계프로그램(통계패키지)
참고문헌
본문내용
의 크기가 감소하는 것이다.
셋째, 最尤推定法(maximum likelihood methods)은 종속변수 y의 i번째 범주에서 독립변수 의 발생확률를 종속변수의 특정범주 하에서 독립변수의 우도 식으로 구하는 방법이다. 만일 독립변수들이 서로 독립이라면 다음 식과 같다.
y의 i번째 범주에서 를 사용했기 때문에, L(x/yi)에 종속된 만큼 yi에 대해서 가중을 부여한 후가 가장 큰 i를 취하여 예측하면 된다.
넷째, 베이지언법의 경우 모든 독립변수 x=(x1,.., xj)가 독립이고 종속변수 y의 i번째 범주에서 독립변수 xj가 발생할 확률은 p(x/yi) = p(x1/yi)p(x2/yi)...p(xj/yi)이다. 예측범주인 p(yi)와 p(xj/yi)의 사전확률은 yi의 표본확률값과 yi에 대한 응답집단에서의 xj의 표본확률값으로 부터 알 수 있다고 가정한다. 또한 yi의 범주들은 총체적이며 상호 배반적이라고 가정한다. 사전확률인 p(yi)는 y의 특정한 범주인 i에 속한 사람들의 비율이 되며 i범주에서의 우도확률 p(xj/yi)은 특정한 속성 xj을 가지면서 i번째 범주에 속한 사람들의 비율이 된다. 따라서 사후확률인은 사전확률과 우도확률의 곱으로 나타낼 수 있다. 즉 무응답자의 예측범주는 i개의 사후확률 중에서 가장 큰 값을 선택하는 방법이다.
Ⅵ. 통계와 통계적연구조사방법
1. 비례배분법(Proportional allocation)
1) 정의
표본을 측의 크기에 따라 각 측에 표본을 배분함에 있어서 모집단 의 제 h번째 측 에서 표본수 를
(h = 1,2, …, L,는 의 크기)
와 같이 결정하는 배분법을 비레배분법(Proportional allocation)이라 한다.
2) 정리 1
층화임의추출법에 대한 모평균 의 불편추정량은
이다.
3) 정리 2
층화임의추출법에 대해서 추정량 의 분산은
(단, )이다.
4) 정리 3
비례배분법에 대한 의 분산은
이다.
5) 정리 4
비례배분법에 의한 의 불편추정량은
이다.
2. 최적배분법(Optimum allocation)
1) 정의 1
층화임의추출법에서의 표본조사의 총비용을 C, 정해진 비용을 C0, 유동비용으로써 h번째 층에서 추출한 표본단위에 필요한 조사비용을 Ch로 타나낸 때,
가 된다. 이와 같이 표본조사의 총비용을 함수로 타나낸 것을 비용함수(cost function) 라 한다.
위의 식을 변형하면
이다.
이것은 C - C0를 C로 바꾸면
이다.
2) 정의 2
방정식 를 사용함에 있어서 정해진 운영비 C와 n크기의 표본추출과 이 표본을 n1,n2 등으로 배분함에 있어서 표본분산 를 최소가 되게 하는 표본배분법을 최적배분법 이라 한다.
3) 정리 3
최적배분법에 있어서 의 불편추정량은 를 최소로 하는 nh의 값은
이다.
3. Neyman 배분법(Neyman allocation)
층화임의추출법으로써 표본조사를 정해진 비용으로써 할 필요가 있다. 그러나 층에 따라 표본단위를 추출하는 비용은 다양하다.
어떤 경우에는 추출비용이 큰 차이를 갖지 않는다. 그래서 비용함수는
에서 Ch가 모든 층에 갖다고 가정해도 좋다. 그래서 Ch = Ct가 된다.
이다. 즉 이므로,
표본크기 n은 일정하게 된다.
(일정)에서 을 최소로 하는 nh를 찾을 때의 배분법을 Neyman 배분법이라 한다.
4. 데밍 배분법(Deming allovation)
데빙 배분(Deming allocation)은 총배용이 일정하게 주어지고 분산 이 최소되게 를 결정하는 방법이다. h층의 하나의 추출단위에 드는 비용이 평균적으로 이며 총비용 c는 비용함수로서 와 같이 든다. 문제는 c=일정하다는 조건하에 분산 이 최소되게 을 구하는 것이다. 최적배분의 경우와 같이 라그란즈의 승수법을 쓰면 쉽게
을 얻는다.
이식은 가 큰 층에 또는 가 작은 층에 표본수를 보다 많이 할당하면 좋은 것을 나타낸다. 각 층마다 가 모두 같다고 가정되면 데밍 배분은 네이만 배분과 일치한다.
네이만 배분과 비례배분을 비교하면 대게 네이만 배분이 신뢰도가 높다. 그러나 조사설계시 층분산 이 알려져 있어야 한다. 또한 층분산의 값이 매우 다른 경우에는 네이만배분이 정도가 높다. 집계는 상당히 복잡하다. 따라서 네이만 배분이나 데밍 배분은 실제로 이용되지 않는다.
Ⅶ. 통계와 통계프로그램(통계패키지)
통계학은 과거에는 많은 사람들에게 배우기 힘든 학문이라는 인식이 있었다. 가장 큰 이유는 통계학을 응용하기 위해서 복잡한 계산을 많이 하여야 되기 때문이었다. 하지만 컴퓨터의 발전은 통계학이 급속하게 여러 분야에서 사용될 수 있게 많은 영향을 주었다. 즉, 컴퓨터는 통계학의 이론에서 나오는 많은 자료에 대한 복잡한 계산을 짧은 시간 내에 처리할 수 있게 하여, 과거에는 현실적인 응용이 불가능하다고 생각되었던 유용한 통계 기법들이 실용화되었기 때문이다. 대량의 자료 처리와 복잡한 계산을 초보자들도 쉽게 하기 위하여 개발된 통계 프로그램들을 통계 패키지(statistical package)라고 한다.
현재 국내에서 많이 사용되고 있는 통계 패키지들은 세계적으로 유명한 SAS, SPSS, BMDP, MINITAB 등과 같은 제품들이다. 이 제품들은 수십년 간에 걸친 연구 개발과 운용 경험이 축적되어 나온 우수한 제품들임에 틀림이 없지만 영어를 쓰지 않는 일반 한국인이 외국산 패키지를 사용하려면 간단한 표를 하나 작성하려고 하여도 매우 힘든 일이다. 또 기능이 매우 다양하고 전문적인 기법까지 다루고 있는 이들 패키지를 구입하여도 실제적으로 대부분의 일반 사용자들은 그림이나 표를 만드는 간단한 목적의 자료 처리에만 이용하고 있다. 이러한 통계 패키지의 구입과 임대에 많은 외화가 소비되고, 앞으로는 더 증가되리라 예상된다.
참고문헌
○ 강완 외(1999), 초등 수학 학습 지도의 이해, 서울 : 양서원
○ 교육부(1997), 수학과 교육과정, 교육부 고시 제1997-15호
○ 김동욱 외(2003), 통계학개론, 박영사
○ 박희창, 저 현대 통계정보의 이해, 자유아카데미
○ 부산대학교 통계학과 자료실, 쉬운 통계학 - 유의성검 증의 유의성
○ 이창효·김종배, 공저쉽게 풀어 쓴 통계학, 대명출판사
셋째, 最尤推定法(maximum likelihood methods)은 종속변수 y의 i번째 범주에서 독립변수 의 발생확률를 종속변수의 특정범주 하에서 독립변수의 우도 식으로 구하는 방법이다. 만일 독립변수들이 서로 독립이라면 다음 식과 같다.
y의 i번째 범주에서 를 사용했기 때문에, L(x/yi)에 종속된 만큼 yi에 대해서 가중을 부여한 후가 가장 큰 i를 취하여 예측하면 된다.
넷째, 베이지언법의 경우 모든 독립변수 x=(x1,.., xj)가 독립이고 종속변수 y의 i번째 범주에서 독립변수 xj가 발생할 확률은 p(x/yi) = p(x1/yi)p(x2/yi)...p(xj/yi)이다. 예측범주인 p(yi)와 p(xj/yi)의 사전확률은 yi의 표본확률값과 yi에 대한 응답집단에서의 xj의 표본확률값으로 부터 알 수 있다고 가정한다. 또한 yi의 범주들은 총체적이며 상호 배반적이라고 가정한다. 사전확률인 p(yi)는 y의 특정한 범주인 i에 속한 사람들의 비율이 되며 i범주에서의 우도확률 p(xj/yi)은 특정한 속성 xj을 가지면서 i번째 범주에 속한 사람들의 비율이 된다. 따라서 사후확률인은 사전확률과 우도확률의 곱으로 나타낼 수 있다. 즉 무응답자의 예측범주는 i개의 사후확률 중에서 가장 큰 값을 선택하는 방법이다.
Ⅵ. 통계와 통계적연구조사방법
1. 비례배분법(Proportional allocation)
1) 정의
표본을 측의 크기에 따라 각 측에 표본을 배분함에 있어서 모집단 의 제 h번째 측 에서 표본수 를
(h = 1,2, …, L,는 의 크기)
와 같이 결정하는 배분법을 비레배분법(Proportional allocation)이라 한다.
2) 정리 1
층화임의추출법에 대한 모평균 의 불편추정량은
이다.
3) 정리 2
층화임의추출법에 대해서 추정량 의 분산은
(단, )이다.
4) 정리 3
비례배분법에 대한 의 분산은
이다.
5) 정리 4
비례배분법에 의한 의 불편추정량은
이다.
2. 최적배분법(Optimum allocation)
1) 정의 1
층화임의추출법에서의 표본조사의 총비용을 C, 정해진 비용을 C0, 유동비용으로써 h번째 층에서 추출한 표본단위에 필요한 조사비용을 Ch로 타나낸 때,
가 된다. 이와 같이 표본조사의 총비용을 함수로 타나낸 것을 비용함수(cost function) 라 한다.
위의 식을 변형하면
이다.
이것은 C - C0를 C로 바꾸면
이다.
2) 정의 2
방정식 를 사용함에 있어서 정해진 운영비 C와 n크기의 표본추출과 이 표본을 n1,n2 등으로 배분함에 있어서 표본분산 를 최소가 되게 하는 표본배분법을 최적배분법 이라 한다.
3) 정리 3
최적배분법에 있어서 의 불편추정량은 를 최소로 하는 nh의 값은
이다.
3. Neyman 배분법(Neyman allocation)
층화임의추출법으로써 표본조사를 정해진 비용으로써 할 필요가 있다. 그러나 층에 따라 표본단위를 추출하는 비용은 다양하다.
어떤 경우에는 추출비용이 큰 차이를 갖지 않는다. 그래서 비용함수는
에서 Ch가 모든 층에 갖다고 가정해도 좋다. 그래서 Ch = Ct가 된다.
이다. 즉 이므로,
표본크기 n은 일정하게 된다.
(일정)에서 을 최소로 하는 nh를 찾을 때의 배분법을 Neyman 배분법이라 한다.
4. 데밍 배분법(Deming allovation)
데빙 배분(Deming allocation)은 총배용이 일정하게 주어지고 분산 이 최소되게 를 결정하는 방법이다. h층의 하나의 추출단위에 드는 비용이 평균적으로 이며 총비용 c는 비용함수로서 와 같이 든다. 문제는 c=일정하다는 조건하에 분산 이 최소되게 을 구하는 것이다. 최적배분의 경우와 같이 라그란즈의 승수법을 쓰면 쉽게
을 얻는다.
이식은 가 큰 층에 또는 가 작은 층에 표본수를 보다 많이 할당하면 좋은 것을 나타낸다. 각 층마다 가 모두 같다고 가정되면 데밍 배분은 네이만 배분과 일치한다.
네이만 배분과 비례배분을 비교하면 대게 네이만 배분이 신뢰도가 높다. 그러나 조사설계시 층분산 이 알려져 있어야 한다. 또한 층분산의 값이 매우 다른 경우에는 네이만배분이 정도가 높다. 집계는 상당히 복잡하다. 따라서 네이만 배분이나 데밍 배분은 실제로 이용되지 않는다.
Ⅶ. 통계와 통계프로그램(통계패키지)
통계학은 과거에는 많은 사람들에게 배우기 힘든 학문이라는 인식이 있었다. 가장 큰 이유는 통계학을 응용하기 위해서 복잡한 계산을 많이 하여야 되기 때문이었다. 하지만 컴퓨터의 발전은 통계학이 급속하게 여러 분야에서 사용될 수 있게 많은 영향을 주었다. 즉, 컴퓨터는 통계학의 이론에서 나오는 많은 자료에 대한 복잡한 계산을 짧은 시간 내에 처리할 수 있게 하여, 과거에는 현실적인 응용이 불가능하다고 생각되었던 유용한 통계 기법들이 실용화되었기 때문이다. 대량의 자료 처리와 복잡한 계산을 초보자들도 쉽게 하기 위하여 개발된 통계 프로그램들을 통계 패키지(statistical package)라고 한다.
현재 국내에서 많이 사용되고 있는 통계 패키지들은 세계적으로 유명한 SAS, SPSS, BMDP, MINITAB 등과 같은 제품들이다. 이 제품들은 수십년 간에 걸친 연구 개발과 운용 경험이 축적되어 나온 우수한 제품들임에 틀림이 없지만 영어를 쓰지 않는 일반 한국인이 외국산 패키지를 사용하려면 간단한 표를 하나 작성하려고 하여도 매우 힘든 일이다. 또 기능이 매우 다양하고 전문적인 기법까지 다루고 있는 이들 패키지를 구입하여도 실제적으로 대부분의 일반 사용자들은 그림이나 표를 만드는 간단한 목적의 자료 처리에만 이용하고 있다. 이러한 통계 패키지의 구입과 임대에 많은 외화가 소비되고, 앞으로는 더 증가되리라 예상된다.
참고문헌
○ 강완 외(1999), 초등 수학 학습 지도의 이해, 서울 : 양서원
○ 교육부(1997), 수학과 교육과정, 교육부 고시 제1997-15호
○ 김동욱 외(2003), 통계학개론, 박영사
○ 박희창, 저 현대 통계정보의 이해, 자유아카데미
○ 부산대학교 통계학과 자료실, 쉬운 통계학 - 유의성검 증의 유의성
○ 이창효·김종배, 공저쉽게 풀어 쓴 통계학, 대명출판사
추천자료
[평생교육]프로그램개발 - 치매 노인 부양가족을 위한 프로그램
[사회복지 프로포절] 어르신들의 여가활용을 위한 노래교실 프로그램 사업계획서 - 설립운영 ...
혼자 아동을 양육하는 리틀파파에 대한 양육과 정서적 지지 지원프로그램(프로그램개발과평가)
(아동복지론) 다문화가정 아동에 대한 인식전환 프로그램(학교프로그램) 보고서
청소년 비행 예방 프로그램-멘토링 프로그램-
[외국의 사회체육프로그램 현황] 미국노인들의 건강증진을 위한 체육 프로그램의 활용방안 연...
[부부가족치료] 중년기 부부관계향상 프로그램 (이론적 배경-중년기 부부의 변화, 중년기 부...
이주여성을 위한 한국 사회적응 교육사업 프로그램 프로포절 - 프로그램개발과평가를 통해 느...
사회복지기관에서 실시하고 있는 청소년프로그램 중 1개를 관찰하여 제시하고 그 프로그램의 ...
(노인대상 프로그램) OO 노인복지관 - 6080 어르신 건강난타 프로그램, 프로포절.PPT자료
장애인 가족이 겪는 애로사항과 지원프로그램 및 문제점과 대안 (장애인가족의 어려움, 애로...
건강가정지원 센터 프로그램 조사하여 장점, 단점, 보완 할 점을 서술식으로 적으세요 [프...
건강가정론] 건강지원센터프로그램중 1개의 프로그램을 선정하여 이에대해 평가하여 보세요.
[간호학] 건강증진프로그램의 개발 산업장 건강증진 프로그램 사례
소개글