생활과통계) 국가통계의 정의 및 e-나라지표 제공 인구통계의 종류

본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.

해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

생활과통계) 국가통계의 정의 및 e-나라지표 제공 인구통계의 종류에 대한 보고서 자료입니다.

본문내용

호황을 누리지 못했고, 그만큼 일자리는 줄었으며, 중공업 역시도 그 시절만큼 많은 남자의 일손을 필요로 하지 않았기 때문이라고 해석할 여지가 있다. 1980년도에서 1990년도 사이의 조출생률 변화, 1990년도에서 2000년도 사이의 변화 모두 같은 맥락으로 설명이 가능하다.
조출생률은 위에서 설명했듯이 인구 1000명 (100명 아니고 1000명) 당 태어난 아이의 수를 말하는 것이다. 1970년도에서 80년도로 넘어가게 되면 인구 1000명당 태어나는 아이의 수가 31.2명이 22.7명으로 확연하게 줄게 된다. 사실, 한국 사회에서 전후세대 (혹은 베이비붐세대) 1955~1963년 사이에 태어난 세대로서 이때 정말 아이를 많이 낳았다. 사실 전통시대부터 아이를 낳는 다는 것은 그만큼 노동력이 많아진다는 뜻으로서 긍정적인 것이었다. 그렇기 때문에 한국전쟁 이후 경제 건설 및 여러 산업 분야를 막론하고 많은 일손이 필요하여 아이를 많이 낳았다. 그 연장선으로서 1970년대의 높은 조출생률을 설명할 수 있고, 같은 맥락으로 1980년대, 1990년대 각각과 그 사이의 변화 역시 이해할 수 있다.
5. 통계분석초기에 자료의 이상치 파악을 위한 검토방법
먼저 통계분석초기에 나타나는 자료의 이상치라 함은 자료의 다른 관찰지들과 일관성이 없는 것으로 나타나는 관찰지나 혹은 관찰지의 집합이라고 정의한다. 물론, 이 정의는 간단하지만 실제 이상치의 개념이나 이상치에 대한 식별은 결코 단순하지 않다. 그러나 때때로 모집단에 속하지 않는 개체가 표본에 실수로 포함되어 그 개체의 관찰값이 표본의 관찰값에 포함되는 경우가 있다. 이것을 바로 이질자료(contaminants)라고 한다. 통계교육원, <<통계기초 및 활용>>, pp. 135-136.
이상치는 몇 가지 경우의 수가 존재한다.
첫 째, 구조적 상황에서 발생하는 이상치가 있다. 먼저 일변량과 다변량 이상치가 있다. 일변량 이상치는 하나의 변수와 관련된 이상치이며, 다변량 이상치는 여러 개의 변수와 관련된 이상치로서 어떤 개체의 다변량 관측지를 보면 각 개별 변수에 관해서는 이상치가 아닐 수도 있지만 다른 여러 변수와의 조합에서 이상치로서 존재할 수 있다.
둘 째, 전연적, 맥락적, 집단적 이상치가 있다. 전연적(global) 이상치는 다른 값과 유의미하게 서로 떨어져 있는 값으로서 가장 통상적으로 생각되는 이상치다. 맥락적 이상치 또는 조건부 이상치는 주어진 상황을 봤을 때 큰 편차를 보이는 이상치다. 그리고 마지막으로 집단적 이상치는 개별 값으로 본다면 이상치가 전혀 아니지만 전체적인 자료로서 봤을 때는 집단과 구별되는 이상치다.
이러한 이상치 파악을 위한 검토 방법에도 여러 가지가 있다. 첫 째, 통계적 기법의 사용을 고려하는 것이 있고, 다음으로는 식별방법 중 가장 쉽다고 알려진 그래프를 통하여 식별하는 방법이 있다. 바로 히스토그램을 통한 방법이다. 다음으로는 이변량 자료의 이상치다. 그런데 이상치를 식별하는 과정에서 자료에 따라 이상치 식별이 어려운 경우가 있다. 이상치 탐색을 어렵게 하는 것을 가면효과와 나눔 효과라고 한다.
모집단 분포 관점에서 이상치의 식별은 사분위수 범위를 이용하는 방법도 있다. 그리고 절사평균(trimmed means)라는 것으로 가장 높고 가장 낮은 특정 퍼센트를 버린 뒤 남아있는 값으로 평균을 구하는 방법이다. 가장 널리 알려지고, 고등학생 때도 많이 배운 내용으로서 표준점수(Z-score)가 있다. 사실 이 방법은 이상치를 판별하는데 도움을 줄 수 있지만 표본의 크기가 작은 상황에서는 오히려 잘못 해석될 위험이 있다. 예를 들어 표본의 크기가 6인 경우 표준점수의 최댓값은 약 2.04이다. 그럴 경우 자료 내의 어떤 값도 이상치라고 판단할 수 없게 된다. 따라서 이럴 경우 중앙값을 이용하여 수정된 표준점수를 이용하여 그 값이 3.5보다 큰 경우 이상치로 간주한다.
6. 출처 및 참고문헌
김석우. <<기초통계학>>. 2007.
정용찬. <<빅 데이터 혁명과 국가통계 활용 전략>>. 2016.
이삼열, 정윤수. <<지식정보사회와 국가통계정책>>. 2008.
신보미. <<정규분포에 대한 교수학적 변환 방식과 학생들의 이해 분석>>. 2012.
김두섭. <<출생성비의 최근 변화와 시뮬레이션을 통한 성선별 출산행위의 추정: 영남 지역을 중심으로>>. 2011.
박상화, 김응익. <<한국의 출생성비의 시계열적 추이에 관한 연구>>. 1996.
통계교육원. <<통계기초 및 활용>>.

키워드

생활과통계, 국가통계의 정의, e-나라지표, 인구통계

소개글

목차

본문내용

키워드

추천자료