목차
Ⅰ. 여는 마당
Ⅱ. 본 마당
1. 통계의 시작과 발전 과정
2. 통계 조사의 방법
3. 통계의 허와 실
①평균에 관한 오류
②대표성 선정에 관한 오류
③‘그저 그렇다’
④시각적 왜곡
⑤ 67퍼센트(%) 조심
⑥'머피의 법칙'
⑦상어는 남자만 공격한다??
⑧여론조사 실패 사례
Ⅲ. 맺는 마당
Ⅱ. 본 마당
1. 통계의 시작과 발전 과정
2. 통계 조사의 방법
3. 통계의 허와 실
①평균에 관한 오류
②대표성 선정에 관한 오류
③‘그저 그렇다’
④시각적 왜곡
⑤ 67퍼센트(%) 조심
⑥'머피의 법칙'
⑦상어는 남자만 공격한다??
⑧여론조사 실패 사례
Ⅲ. 맺는 마당
본문내용
곳까지 수영을 하는 사람들은 주로 남자들이므로 상어공격의 희생자들 중에 남자들이 압도적으로 많은 것이다.
이처럼 어떤 대상들을 비교할 때 원래 대상들의 크기에 차이가 있다는 사실을 고려하지 않으면 잘못된 결론에 도달하게 된다.
⑧여론조사 실패 사례
<사례 1> Thomas Dewey
1936년, 1940, 1944년의 선거에서 재미를 보았던 Gallup을 포함하여 수많은 정치여론조사기관들이 1948년의 선거에서는 크게 낭패를 보게 된다. 현직 대통령 Harry Truman을 제치고 뉴욕 주지사인 Thomas Dewey가 대통령에 당선될 것이라고 예측하였으나, 선거결과는 Truman의 승리로 나타났다. 수많은 실패요인 가운데 몇가지만 살펴보면, 우선 Truman 후보가 상승세를 타고 있었음에도 불구하고, 거의 모든 조사자들이 10월초(선거는 11월)에 조사를 끝내버린 점을 들 수 있다. 둘째, 선거운동기간 동안 많은 유권자들이 유동적이었으나 투표장에 들어설 때는 Truman의 지지자가 되어 있었던 점을 들 수 있다. 그러나 무엇보다 중요한 이유는 Gallup이 사용하였던 표본이 '대표성'이 없었다는 점이다. Gallup이 이전의 선거에서 사용하여 재미를 보았던 할당표집방법이 1948년의 선거에서는 통하지 않았던 것이다. 할당표집을 하기 위해서는 유권자의 특성에 관한 정확한 자료가 필수적인 요건이다. 여론조사에서 사용하는 이같은 유권자의 특성은 대부분 센서스자료에 바탕을 두고 작성하게 되는데, 1948년의 선거조사에서 사용하였던 응답자의 특성은 1940년 센서스자료를 사용하였다. 그러나, 2차대전을 거치는 동안 미국사회는 엄청 난 변화를 겪었다. 특히, 농촌에서 도시로 인구가 급격하게 이동하는 도시화현상이 이 기간 동안 두드려졌는데, Gallup이 사용한, 미국이 2차대전에 참전하기 전인 1940년의 센서스자료에는 이같은 현상이 정확하게 반영되지 않았던 것이다. 도시거주자들 사이에서 일반적으로 민주당지지도가 높았는데도 불구하고 농촌인구가 과다계상된 표본자료를 바탕으로 조사한 결과 예측이 빗나갈 수밖에 없었다.
<사례 2> 1996년 한국의 4 11총선
1996년 우리나라의 4 11총선에서는 4개 방송기관이 5개의 전문여론조사기관에 의뢰해서 조사한 예측결과를 투표가 끝나는 시간(오후 6시정각)에 맞춰 발표하여 사람들을 놀라게 했는데, 사람들은 발표 내용에 대해 놀라고, 많은 부분이 오보였다는데서 또 한번 놀랐다.
개표가 끝나고 많은 사람들이 4 11총선 결과예측 여론조사의 문제점에 대해 지적하였는데, 대부분의 사람들이 문제의 핵심을 찾지 못하고 조사의 방법만 탓하였다. 즉, 4 11총선 선거조사에서 잘못된 예측이 많이 나온 것은 사람들이 지적하는 바와 같이 '전화조사'였기 때문이 아니고, '조사를 오후 2시에 끝냈기' 때문에 조사대상의 선정(표본선정)이 잘못되었고 그 결과 예측이 빗나갈 수밖에 없었던 것이다.
표본조사의 성패는 표본의 '대표성'에 따라 좌우된다. 그런데 방송사의 4 11총선 조사에서는 투표 마감시간인 6시보다 이른 2시에 조사를 마쳤고, 그나마 그 시간까지 집에 들어온 사람만 조사하였다. 2시에 조사를 마침으로써 아침 일찍 투표를 마치고 놀러 가거나 일을 보다 온 사람(대개 젊은 층이나 남자가 많다)과 투표를 마치고 집에서 시간을 보냈던 사람들(대개 노약자나 여자가 많다)의 특성이 다른 만큼 그들의 정치성향도 다를 수 있다는 점이 고려되지 않았던 것이다. 결과적으로, 25만명에 이르는 '거대한 표본'이 유권자를 대표할 수 있는 대표가 아니라 단순히 '많은 응답자'에 지나지 않았기 때문에, 3천여만 명이 넘는 전체 유권자의 의견을 대표할 수 있는 '표본'이 아니라 아무런 의미가 없는 '25만명의 집단'이 되고 말았다. 조사결과가 빗나간 것은 이같이 대표성이 없는 표본을 조사한 것을 전체 유권자의 의견으로 발표한 데에서 문제가 생긴 것이지, 조사수단으로 전화조사를 택했는가 면접조사나 우편조사를 택했는가 하는 조사매체의 선택과 관련된 문제가 아니었다. 개표후 많은 사람들이 '전화조사'가 빗나간 예측의 원인인 것처럼 매도하였는데 사실은 원인이 다른 데에 있었던 것이다.
Ⅲ. 맺는 마당
컴퓨터 기술의 발달과 통계 프로그램의 발전, 그리고 통계 조사 기법의 다양화로 통계는 더욱 발전하였으며 그 응용의 폭도 점차 넓어지고 있다. 그리고 통계적 수치는 복잡한 우리의 생활을 조금이라도 더 간단히 알 수 있게 해준다는 점에서 매우 유용하다. 즉 간단히 숫자를 통해 여러가지 사회과학적인 현상들을 알 수 있기 때문이다. 그러나 이로 인해 야기되는 문제점들도 적지 않다. 얼마든지 조사자가 조사 결과를 조작할 가능성이 있다는 것이다. 또한 숫자로 단순화하여서 나타내기에는 무리가 있는 사회과학적 현상들을 단지 숫자로만 표현하는 과정에서도 여러 가지 오류가 나타남을 살펴보았다.
따라서 여러 가지 통계자료를 접하는 우리들은 그 결과를 무조건 맹신하는 것이 아니라 비판적 자세를 가지고 바라봐야 할 것이다. 표본 선출은 적절했는지, 조사 방법과 과정은 적절했는지, 그리고 그 해석이 적절한지 면밀히 살펴봐야 할 것이다. 전문가가 통계 내용을 해석해 주었다고 해서 무조건 맹신해서는 안된다는 것이다. 아울러 통계 조사를 실시한 기관들도 표본내용, 설문 방법, 조사원의 자질, 통계기법등을 투명하게 공개해야 할 것이다. 아직은 조사한 기관이 결과만 내놓고 그 과정은 잘 밝히지 않는 경우가 많이 있다. 통계에 대해서 잘 모르는 일반인들에게 조사 과정과 통계 방법에 대한 내용을 알려줘봤자 이해하지 못할 것이라 생각하고, 또한 그 과정을 기록하려면 추가적인 비용도 들기 때문일 것이다.
그러나 통계 분석은 이제 대통령 후보를 정할 만큼 위력적인 영향력을 갖게 되었다. 그리고 통계 수치가 난무하는 생활 속에서 통계의 오류에 빠지지 않기 위해서는, 일반인들도 통계에 대한 기본적인 지식을 갖출 필요가 있고, 조사 기관들도 그 과정을 투명하게 공개하는 분위기가 형성되어야 할 것이다.
** 참고자료
인터넷
조사방법론과 사회통계(사회조사분석을위한) - 배규환외
통계학자와 거짓말쟁이 - 로버트 후크
이처럼 어떤 대상들을 비교할 때 원래 대상들의 크기에 차이가 있다는 사실을 고려하지 않으면 잘못된 결론에 도달하게 된다.
⑧여론조사 실패 사례
<사례 1> Thomas Dewey
1936년, 1940, 1944년의 선거에서 재미를 보았던 Gallup을 포함하여 수많은 정치여론조사기관들이 1948년의 선거에서는 크게 낭패를 보게 된다. 현직 대통령 Harry Truman을 제치고 뉴욕 주지사인 Thomas Dewey가 대통령에 당선될 것이라고 예측하였으나, 선거결과는 Truman의 승리로 나타났다. 수많은 실패요인 가운데 몇가지만 살펴보면, 우선 Truman 후보가 상승세를 타고 있었음에도 불구하고, 거의 모든 조사자들이 10월초(선거는 11월)에 조사를 끝내버린 점을 들 수 있다. 둘째, 선거운동기간 동안 많은 유권자들이 유동적이었으나 투표장에 들어설 때는 Truman의 지지자가 되어 있었던 점을 들 수 있다. 그러나 무엇보다 중요한 이유는 Gallup이 사용하였던 표본이 '대표성'이 없었다는 점이다. Gallup이 이전의 선거에서 사용하여 재미를 보았던 할당표집방법이 1948년의 선거에서는 통하지 않았던 것이다. 할당표집을 하기 위해서는 유권자의 특성에 관한 정확한 자료가 필수적인 요건이다. 여론조사에서 사용하는 이같은 유권자의 특성은 대부분 센서스자료에 바탕을 두고 작성하게 되는데, 1948년의 선거조사에서 사용하였던 응답자의 특성은 1940년 센서스자료를 사용하였다. 그러나, 2차대전을 거치는 동안 미국사회는 엄청 난 변화를 겪었다. 특히, 농촌에서 도시로 인구가 급격하게 이동하는 도시화현상이 이 기간 동안 두드려졌는데, Gallup이 사용한, 미국이 2차대전에 참전하기 전인 1940년의 센서스자료에는 이같은 현상이 정확하게 반영되지 않았던 것이다. 도시거주자들 사이에서 일반적으로 민주당지지도가 높았는데도 불구하고 농촌인구가 과다계상된 표본자료를 바탕으로 조사한 결과 예측이 빗나갈 수밖에 없었다.
<사례 2> 1996년 한국의 4 11총선
1996년 우리나라의 4 11총선에서는 4개 방송기관이 5개의 전문여론조사기관에 의뢰해서 조사한 예측결과를 투표가 끝나는 시간(오후 6시정각)에 맞춰 발표하여 사람들을 놀라게 했는데, 사람들은 발표 내용에 대해 놀라고, 많은 부분이 오보였다는데서 또 한번 놀랐다.
개표가 끝나고 많은 사람들이 4 11총선 결과예측 여론조사의 문제점에 대해 지적하였는데, 대부분의 사람들이 문제의 핵심을 찾지 못하고 조사의 방법만 탓하였다. 즉, 4 11총선 선거조사에서 잘못된 예측이 많이 나온 것은 사람들이 지적하는 바와 같이 '전화조사'였기 때문이 아니고, '조사를 오후 2시에 끝냈기' 때문에 조사대상의 선정(표본선정)이 잘못되었고 그 결과 예측이 빗나갈 수밖에 없었던 것이다.
표본조사의 성패는 표본의 '대표성'에 따라 좌우된다. 그런데 방송사의 4 11총선 조사에서는 투표 마감시간인 6시보다 이른 2시에 조사를 마쳤고, 그나마 그 시간까지 집에 들어온 사람만 조사하였다. 2시에 조사를 마침으로써 아침 일찍 투표를 마치고 놀러 가거나 일을 보다 온 사람(대개 젊은 층이나 남자가 많다)과 투표를 마치고 집에서 시간을 보냈던 사람들(대개 노약자나 여자가 많다)의 특성이 다른 만큼 그들의 정치성향도 다를 수 있다는 점이 고려되지 않았던 것이다. 결과적으로, 25만명에 이르는 '거대한 표본'이 유권자를 대표할 수 있는 대표가 아니라 단순히 '많은 응답자'에 지나지 않았기 때문에, 3천여만 명이 넘는 전체 유권자의 의견을 대표할 수 있는 '표본'이 아니라 아무런 의미가 없는 '25만명의 집단'이 되고 말았다. 조사결과가 빗나간 것은 이같이 대표성이 없는 표본을 조사한 것을 전체 유권자의 의견으로 발표한 데에서 문제가 생긴 것이지, 조사수단으로 전화조사를 택했는가 면접조사나 우편조사를 택했는가 하는 조사매체의 선택과 관련된 문제가 아니었다. 개표후 많은 사람들이 '전화조사'가 빗나간 예측의 원인인 것처럼 매도하였는데 사실은 원인이 다른 데에 있었던 것이다.
Ⅲ. 맺는 마당
컴퓨터 기술의 발달과 통계 프로그램의 발전, 그리고 통계 조사 기법의 다양화로 통계는 더욱 발전하였으며 그 응용의 폭도 점차 넓어지고 있다. 그리고 통계적 수치는 복잡한 우리의 생활을 조금이라도 더 간단히 알 수 있게 해준다는 점에서 매우 유용하다. 즉 간단히 숫자를 통해 여러가지 사회과학적인 현상들을 알 수 있기 때문이다. 그러나 이로 인해 야기되는 문제점들도 적지 않다. 얼마든지 조사자가 조사 결과를 조작할 가능성이 있다는 것이다. 또한 숫자로 단순화하여서 나타내기에는 무리가 있는 사회과학적 현상들을 단지 숫자로만 표현하는 과정에서도 여러 가지 오류가 나타남을 살펴보았다.
따라서 여러 가지 통계자료를 접하는 우리들은 그 결과를 무조건 맹신하는 것이 아니라 비판적 자세를 가지고 바라봐야 할 것이다. 표본 선출은 적절했는지, 조사 방법과 과정은 적절했는지, 그리고 그 해석이 적절한지 면밀히 살펴봐야 할 것이다. 전문가가 통계 내용을 해석해 주었다고 해서 무조건 맹신해서는 안된다는 것이다. 아울러 통계 조사를 실시한 기관들도 표본내용, 설문 방법, 조사원의 자질, 통계기법등을 투명하게 공개해야 할 것이다. 아직은 조사한 기관이 결과만 내놓고 그 과정은 잘 밝히지 않는 경우가 많이 있다. 통계에 대해서 잘 모르는 일반인들에게 조사 과정과 통계 방법에 대한 내용을 알려줘봤자 이해하지 못할 것이라 생각하고, 또한 그 과정을 기록하려면 추가적인 비용도 들기 때문일 것이다.
그러나 통계 분석은 이제 대통령 후보를 정할 만큼 위력적인 영향력을 갖게 되었다. 그리고 통계 수치가 난무하는 생활 속에서 통계의 오류에 빠지지 않기 위해서는, 일반인들도 통계에 대한 기본적인 지식을 갖출 필요가 있고, 조사 기관들도 그 과정을 투명하게 공개하는 분위기가 형성되어야 할 것이다.
** 참고자료
인터넷
조사방법론과 사회통계(사회조사분석을위한) - 배규환외
통계학자와 거짓말쟁이 - 로버트 후크
추천자료
(유아연구및평가 C형) 검사의 신뢰도와 타당도에 대해 자세히 설명하시오.
선발관리 전반에 대한 연구
[CRM][고객관계관리][한국형 CRM][한국형 고객관계관리][고객관리][고객서비스][관계마케팅]C...
회계이익의 예측을 위한 기본적 요소분석에 관한 고찰
[수학][수학 역사][수학과 음악][수학과 사칙연산][수학과 확률][수학과 함수][수학과 불대수...
영유아 수학 교육 환경구성
확률의 감정을 읽고
사회복지조사방법론 요약
워터마킹 알고리즘의 특징, 워터마킹 알고리즘의 종류, 워터마킹 알고리즘의 기본원리, 워터...
[사회복지조사론] 측정의 타당도와 측정의 신뢰도에 대한 이해와 정리
[기계계측공학] Chapter 4. Random Errors and Statics.PPT자료
사회복지조사론 전단원 중요핵심 요약 총정리 사회복지사 1급 시험준비 (과학적 방법과 조사...