기술통계량의 특징
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

기술통계량의 특징에 대한 보고서 자료입니다.

본문내용

population variance)이라 하며 (시그마 제곱)이라 표기하고 이때의 표준편차를 모표준편차(population standard deviation)라 하고 σ(시그마)라 표기한다. 한편, 자료가 표본일 때의 분산을 표본분산(sample variance)이라 하고 으로 표기하고, 이때의 표준편차를 표본표준편차(sample standard deviation)라 하고 S로 표기한다. 이들이 계산공식은 다음과 같이 정의된다.
변동계수
변동계수(coefficient of variation)는 여러 종류의 자료의 산포도를 비교하는데 사용되어진다. 만약 두 자료의 평균이 같다면 각 자료의 표준편차를 비교함으로써 어느 자료의 분포가 상대적으로 넓게 퍼져있는지를 판단할 수 있을 것이다. 그러나 두 자료의 평균이 서로 다를 때에는 표준편차만을 비교함으로써 두 자료의 상대적인 산포의 정도를 측정할 수는 없다. 따라서 서로 다른 평균과 표준편차를 갖는 여러 자료의 상대적인 변동 혹은 산포를 측정하기 위해서는 각 자료의 평균과 표준편차를 동시에 고려한 변동계수가 유용하게 사용되어지며, 다음과 같이 정의된다.
변동계수 : υ = (S / ) × 100%
왜도
지금까지는 주어진 자료의 대표값과 산포도가 측정되면 이러한 특성치를 통하여 자료의 중심위치 및 퍼져있는 정도를 파악할 수 있었으나, 분포의 특성을 좀더 적절하게 설명하기 위해서는 자료가 좌우 대칭분포인가, 혹은 한 쪽으로 얼마나 치우친 분포인가를 측정하는 것이 필요하다.
자료의 분포가 기울어진 방향과 정도를 나타내는 척도를 왜도(skewness)라고 하며, 피어슨의 왜도 계수(pearsonian coefficient of skewness)는 다음과 같이 정의된다.
이 값이 양(음)의 값을 가지고 있을 때는 오른쪽(왼쪽)으로 기울어져 있다고 할 수 있으며 그림으로 나타내면 다음과 같다. 피어슨의 왜도계수에 의하여 산출된 왜도값에 따라 분포모양의 특징을 다음과 같이 해석할 수 있다.
만약 왜도가 0이면 (a)의 경우와 같이 좌우 대칭인 분포를 이룬다. 왜도가 양수이면 (b)의 경우와 같이 오른쪽에 긴 꼬리가 있고, 왼쪽에는 짧은 꼬리를 갖는 비대칭 분포를 나타낸다. 반대로 왜도가 음수이면 (c)의 경우와 같이 왼쪽에 긴 꼬리가 있고, 오른쪽에는 짧은 꼬리를 갖는 비대칭 분포를 나타낸다. 또한 분포의 형태에 따라서 중심위치를 측정하는 대표값들의 위치가 달라지기 때문에 분포의 형태와 대표값들의 위치를 비교하여 보기로 하자. (a)와 같이 분포가 대칭일 경우에는 평균, 중앙값, 최빈값은 일치하지만, (b)와 같이 양의 왜도분포는 오른쪽 꼬리에 다른 대부분의 자료값보다 매우 큰 값이 존재 하기 때문에 왜도분포는 오른쪽 꼬리에 다른 대부분의 자료값보다 매우 큰 값이 존재하기 때문에 평균은 중앙값에 비하여 커지게 되어 최빈값 < 중앙값 < 평균 의 관계가 성립된다.
그리고 (c)와 같이 음의 왜도분포는 왼쪽 꼬리에 다른 대부분의 자료값보다 매우 작은 값이 존재하기 때문에 평균은 중앙값에 비하여 작아지게 되어 평균 < 중앙값 < 최빈값 의 관계가 성립하게 된다.
11.통계적 그림
앞서 우리는 표본통계량을 계산하여 표본의 특성을 산술적으로 다루었으나, 여기서는 표본의 특성을 도수분포표나 그림표에 의하여 시각적으로 표본하는 방법에 대하여 살펴보기로 하자.
1. 도수분포표와 히스토그램 작성
양적 자료의 도수분포표를 작성하는 절차를 어느 대학에서 관측된 45명의 여학생들의 키의 자료를 통하여 설명하고자 한다.
1) 계급의 수 결정
양적 자료의 도수분포표를 작성하기 위해서는 먼저, 서로 인접한 자료값들을 집단화하여 전체자료를 몇 개의 계급(집단)으로 나눈다. 도수분포에서 계급의 수가 많을수록 더 상세한 내용을 나타낼 수 있으나, 계급의 수가 많아지면 자료를 요약하는데 효율성을 상실하게 된다. 반면, 계급의 수가 너무 적게 되면 정보가 너무 압축 되여 분포의 모양을 알아보기가 어렵게 된다. 따라서 최적 계급의 수는 주관적으로 결정될 수 있지만 널리 사용되고 있는 방법 중에 하나는 다음과 같다. 자료의 수가 n이면 적절한 계급수 k는 을 만족시키는 최수의 정수이다. 따라서 위의 자료의 수는 45개이므로 k=6이 된다.
2) 계급의 간격 결정
계급간격의 결정은 계급수의 결정과 관련되어 있다. 계급간격을 결정하는데 기본원칙은 모든 간격이 같아야 한다는 점이다. 만약 계급구간이 같지 않다면 계급도수의 차이가 계급구간의 차이 때문인지 분포의 집중에서 오는 것인지 쉽게 판별하기가 어렵게 된다. 만약 계급의 수를 6으로 한다면 계급간격은 다음과 같이 구해진다. 여기서 반올림하는 이유는 양쪽 극단값을 도수분포표에 포함시키기 위해서다.
3) 계급의 한계 결정
계급의 출발점과 마지막 점을 가리켜 계급의 한계라 한다. 그 중에서도 출발점을 하한계, 마지막 점을 상한계라고 부르기도 한다. 먼저 첫 번째 계급의 하한계를 정해야 하는데, 어떤 자료값도 계급의 한계에 놓이지 않게 하기 위해서는 자료의 최소값보다 조금 작은 값을 선택한다. 일반적으로 자료의 최소단위의 반을 자료의 최소값에서 뺀값을 많이 사용한다. 위 자료이 첫 번째 계급의 하한계는 148-0.5=147.5가 된다. 계급간격이 5이므로 첫 번째 계급의 구간은 147.5이상 152.5미만이 될 것이다.
4) 계급도수 및 상대도수 계산
각 계급에 속하는 관측값의 수를 세어 계급의 도수를 구하고, 각 계급의 도수를 전체자료수로 나누어 계급의 상대도수를 구한다.
양적 자료의 도수분포표를 구한 다음, 이를 그림으로 표현하는 방법중의 하나가 히스토그램이다. 히스토그램을 그릴 때 수평축에는 계급의 한계 혹은 계급의 중앙값을 표시하고 수직 축에는 도수 혹은 상대도수를 나타낸다. 또한 계급의 간격이 서로 다를 때 히스토그램의 막대의 높이는 계급의 상대도수를 계급의 간격으로 나눈 값이며, 이를 상대도수밀도라고 한다. 상대도수 밀도를 이용하여 히스토그램을 그리면 막대면적은 합은 1이 된다.
[예제] 어느 대학 여학생의 신장자료(cm)에 대하여 계급의 수는 6으로 한 도수분포표와 히스토그램을 작성하여라.

키워드

  • 가격2,000
  • 페이지수10페이지
  • 등록일2012.03.13
  • 저작시기2010.05
  • 파일형식한글(hwp)
  • 자료번호#804878
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니