본문내용
된 내용을 종합적으로 판단되어져야 한다. 예를 들어 어떤 기준에 의해 서울에 사는 사람들 중 구로구에 사는 사람들의 소득을 조사한다고 하자. 그런데 만약 여기에 빌 게이츠나 손정희가 들어있다고 해보자. 어떤 통계 분석을 써도 결과가 왜곡될 가능성이 존재한다. 이럴 경우 관측치를 제거하는 방법이 가장 좋다. 가장 쉽게는 이 관측된 숫자를 제거하는 것인데 일일이 제거하기에는 너무 큰 리소스 낭비가 될 수 있다. z-score로 이상치를 제거하는 방법이 있다. 표준 점수와 편차치를 구하고 그 일정 범위를 넘어가는 값을 제거하는 방법이다. 또 이상치를 판단하는 기준으로 잔차(residual)를 기반으로 판단하는 방법이 있다. 잔차는 모형에 의한 추정치와 관측치의 편차를 의미하는데 이 잔차를 표준화시키면 스튜던트 잔차로 변형될 수 잇다. 일반적으로 잔차는 데이터 스케일의 변화에 따라 범위가 달라지는데 스튜던트 잔차는 표준화를 시켰기 때문에 스케일에 상관없이 동일한 결과가 나온다. 절대값 3이상을 이상치로 간주하며, 스케일을 변형시켜 잔차와 스튜던트 잔차를 비교하여 이상치를 확인할 수 있다. 이외 이상치를 제거하는 여러 방법이 존재한다. 허나 앞서 말한바와 같이 이상치를 제거하기 위한 표준화된 방법은 없으며 여러 통계프로그램과 방법론을 기반으로 내가 연구하고 조사하는 내용에 대해 적절하게 활용하고 합리적인 근거를 마련하는 것이 중요하다고 할 수 있다. 이상치 제거는 연구의 합리적 도출을 위해 반드시 필요한 작업이라 볼 수 있다.
참고문헌
국가통계 이해 , 통계교육원,발간등록번호 11-1240162-000020-01
참고문헌
국가통계 이해 , 통계교육원,발간등록번호 11-1240162-000020-01
추천자료
- [과외]고등 수학 1 해답편
- [과외]고등 국토의 이해 02
- [비정규직 해결방안] 비정규직의 개념, 공공부문 비정규직 정규직 전환의 필요성, 공공부문 ...
- 2017년 2학기 생활과통계 중간시험과제물 공통(국가통계, e-나라지표, 정규분포 등)
- 생활과통계=1. 국가통계를 정의하고 국가통계의 종류를 예를 들어 설명하라 2. e-나라지표에...
- 생활과 통계 과제 - 국가통계를 정의하고 국가통계의 종류를 예를 들어 설명하라, e-나라지표...
- 2018년 2학기 생활과통계 중간시험과제물 공통(국가통계의 필요성, 임의추출 등)
- 2019년 2학기 생활과통계 중간시험과제물 공통(국가통계, 정규분포, 출생성비 정의 등)
- 생활과학 = 생활과통계 = 1 국가통계를 정의하고 e-나라지표에서 제공되는 인구통계의 종류를...
소개글