목차
1.
서론
2.
빈도분포표와 히스토그램
3.
자료의 대표성
4.
자료의 표준화
5.
결론
서론
2.
빈도분포표와 히스토그램
3.
자료의 대표성
4.
자료의 표준화
5.
결론
본문내용
료를 가장 대표한다고 알려져 있으나, 측정값 중에 너무 값이 크거나 너무 값이 작은 이상치(Outlier)가 포함되어 있을 때에는 평균이 자료를 대표하는 구실을 하지 못하게 되므로 중앙값이나 최빈값이 평균을 보다 대표한다고 할 수 있다. 최근 개봉영화 러닝타임 데이터의 평균은 총 러닝타임 3,157분을 개수 30으로 나눈 105.2분이다. 중앙값은 104분이며, 최빈값은 108분이다. 이상치가 존재하기는 하지만 그 수가 작고 평균으로부터 너무 크게 떨어져 있지 않기 때문에 평균, 중앙값, 최빈값의 차이가 크지 않음을 알 수 있다. 그러므로 이 경우에는 평균값이 전체 데이터를 가장 잘 대표한다고 할 수 있다.
(3) 자료의 표준화
자료의 표준편차는 12.5분이다. 표준편차는 분산의 제곱근으로 분산은 편차를 제곱하여 합한 값을 평균한 값이다. 최근 개봉한 영화의 러닝타임 데이터에서 편차 제곱의 합은 4,701분이며 이것을 평균하면 156.7분이 나오고 이것의 제곱근을 구하면 12.5분이 나온다. 최근 개봉한 영화의 러닝타임 데이터가 정규분포를 따른 다고 할 때, [92.7분, 117.7분] 범위에 속하는 데이터가 95%분포 안에 속하므로 특이값이 분포의 모양에 큰 영향을 주지 못한다는 사실을 알 수 있다.
3. 결론
지금까지 최근 개봉한 영화의 러닝타임 데이터를 활용하여 데이터의 대푯값과 분포를 조사할 수 있는 기초적인 통계량에 대하여 계산해 보았다. 원 데이터로만 살펴보아서는 알 수 없었던 자료의 특징도 통계 지식을 활용하면 금방 파악할 수 있다.
[참고문헌]
1. 김홍준, 『경영통계학』, 명진, 2017
(3) 자료의 표준화
자료의 표준편차는 12.5분이다. 표준편차는 분산의 제곱근으로 분산은 편차를 제곱하여 합한 값을 평균한 값이다. 최근 개봉한 영화의 러닝타임 데이터에서 편차 제곱의 합은 4,701분이며 이것을 평균하면 156.7분이 나오고 이것의 제곱근을 구하면 12.5분이 나온다. 최근 개봉한 영화의 러닝타임 데이터가 정규분포를 따른 다고 할 때, [92.7분, 117.7분] 범위에 속하는 데이터가 95%분포 안에 속하므로 특이값이 분포의 모양에 큰 영향을 주지 못한다는 사실을 알 수 있다.
3. 결론
지금까지 최근 개봉한 영화의 러닝타임 데이터를 활용하여 데이터의 대푯값과 분포를 조사할 수 있는 기초적인 통계량에 대하여 계산해 보았다. 원 데이터로만 살펴보아서는 알 수 없었던 자료의 특징도 통계 지식을 활용하면 금방 파악할 수 있다.
[참고문헌]
1. 김홍준, 『경영통계학』, 명진, 2017
추천자료
통계학:조사방법론-표본추출,기술통계,확률이론,통계적추론
스크린쿼터
영화 시장 유통 구조 독과점 문제점, 온라인 상영관 문제점
★ 경영통계학 - k사가 제조하는 자동차의 리터당 주행거리는 평균 14.2km라고 표시되어있다. ...
2020년 2학기 보건통계학 출석수업대체시험 과제물(주관식 문제)
경영통계학 ) 최근 2년간 개봉한 영화 30개를 무작위로 골라 영화 제목과 상영시분(분)을 기...
경영통계학 ) 연속확률분포에 대하여 요약 정리하시오
경영통계학 ) 학생들의 IQ와 대학입시 합격률 간의 관계를 알아보기 위해 3년간 총 1000명의 ...
소개글