목차
-통계자료의 수집
1. 표본조사
2. 측정과 척도
-자료의 정리와 기술통계
1. 표와 그래프
2. 대표값과 분포모양의 측도
3. 두 변수간의 연관성 측도
-통계자료의 분석
1. 확률과 확률분포
2.표본분포와 추정
3. 가설검정의 원리
4. 흔히 사용되는 통계적 분석방법
1. 표본조사
2. 측정과 척도
-자료의 정리와 기술통계
1. 표와 그래프
2. 대표값과 분포모양의 측도
3. 두 변수간의 연관성 측도
-통계자료의 분석
1. 확률과 확률분포
2.표본분포와 추정
3. 가설검정의 원리
4. 흔히 사용되는 통계적 분석방법
본문내용
종모양의 좌우대칭이다. 외딴점이 없다.
. 모든 정규분포는 관측치의 68.3%는 평균에서 아래 위로 1 표준편차 이내에 위치
95.4%는 평균에서 아래 위로 2 표준편차
99.7%는 평균에서 아래 위로 3 표준편차
. 표준정규분포: 정규확률변수 X를 평균에서 떨어진 거리에 대한 표준편차의 비로 변환.
Z=
{ X- mu } over { sigma }
. 정규분포가 아닌 확률분포가 정규분포와 유사한 분포화를 보이는 것을 정규근사.
.
2.표본분포와 추정
1) 통계적 추론의 논리적 근거
2) 왜 표본분포를 알아야 하는가
. 표본추출변동 : 통계량들은 추출된 표본마다 다른 값을 나타낼 수 있다.
. 표본분포: 표본통계량들이 나타내는 확률분포. 통계적 추론의 출발이 표본통계이므로
표본통계량의 확률분포인 표본분포를 아는 것이 필수.
3) 중심극한 정리
. 모집단이 정규분포를 하지 않는 경우에도 표본의 크기가 충분히 크면 표본평균의
분포는 근사적으로 정규분포를 한다. Z=
{ X - mu } over { sigma / sqrt { n } }
4) 표본분포에는 어떤 것들이 있는가
. 정규분포 아니지만 정규분포를 하는 모집단에서 추출한 표본에 적용되는 t분포와 카이 제곱 분포.
. t분포: 모표준편차를 모를 때 모평균 추정(n<30).
모표준편차S=
sqrt { { sum from { } to { } { (X_{ i } - bar { X } )^{ 2 } } } over { n-1 } }
T=
{ bar { X } - mu } over { S/ sqrt { n } }
- 자유도(독자적으로 변수값을 가질 수 있는 측정치의 갯수)가 작을수록 모양이 납 작해지고, 클수록 표준정규분포에 가까워진다.
. 카이제곱분포: 모분산에 대해서 통계적 추론. V=
{ (n-1)S^{ 2 } } over { sigma ^{ `^{ 2 } } }
- 자유도 작을수록 오른쪽 긴꼬리, 클수록 대칭형태.
5) 좋은 추정의 조건
. 추정통계량의 표준편차를 표준오차
. 최소분산불편추정법 : 불편(偏)추정통계량(평균이 추정하려는 모수)이면서 표준오차가 작은 비뚤린추정통계량 것을 택할수록좋은추정
6) 신뢰구간이란
. 점추정 : 모수를 하나의 수치로 추정하는 것.
. 신뢰구간 : 모수가 위치할 어떤 구간.
. 신뢰수준: 신뢰구간이 모평균을 포함한다는 사실의 믿음 정도
. 모평균에 대한 95%신뢰수간은 구간추정 무한반복으로 구해진 신뢰구간의 95%에서
모평균을 포함하게 될 것이라는 의미.
. 신뢰구간의 범위는 Z값과 모표준편차에 의해 결정.(Z크고 클수록 큰 신뢰구간)
. 오차한계 : Z
7) 표본분포가 어떻게 추정에 이용될 수 있는가
. 모평균 추정
. 모분율 추정
. 모분산 추정
3. 가설검정의 원리
- 가설검정 : 모수에 관한 가설의 타당성 영부를 판정하는 과정.
- 모수검정 : 모집단의 확률분포 및 그로부터 유도된 표본분포 이용하는 통계적 가설검정
1) 귀무가설과 대립가설
- 대립가설 : 주창자가 타당성을 입증하고자 하는 가설(
H_{ 1 } )
- 귀무가설 : 대립가설에 반대되는 가설(
H_{ 0 } )
2) 가설검정의 오류
. 1종 오류( 오류): 귀무가설이 참인데 기각 위양성(false positive)
. 2종 오류( 오류): 귀무가설이 참이 아닌데 기각하지 못함 위음성(false negative)
3) p값
. 유의수준 값:
. p값(외부확률) : 임의의 자료가 분포에서 양 꼬리쪽으로 치우친 어떤값보다 크거나 작을 확률의 크기 (95% p=0.05)
4) 어떻게 가설검정의 원칙을 세울 수 있는가
. p값이 유의수준보다 작거나 같으면 귀무가설 기각!
1종 오류를 p값만큼 감수.
. 정규검정법(Z검정) : p,Z를 이용한 검정법
. t검정법 : 검정통계량으로 확률변수 T를 이용한 검정법
가설검정 단계
① 귀무가설, 대립가설 설정
② 유의수준
③ 검정통계량 설정
④ 표본에서 p값 계산하여 p= 되는 값 구한다.
⑤ p가 보다 작으면 유의수준 에서 귀무가설 기각
5) 기각역, 단측 및 양측검정
. 임계값 : p= 가 되는 검정통계량의 절대값
. 기각역 : 귀무가설을 기각할 수 있게 해주는 검정통계량 값의 영역
. 양측검정 : 기각역 및 p값이 귀무가설 하에서 분포의 양 꼬리 쪽을 가리킴
6) 가설검정의 오용
tf gv
4. 흔히 사용되는 통계적 분석방법
1) 모평균 비교
2) 모평균 차이 검정
3) 짝짓기
4) 단측검정, 양측검정
5) 모분율 차이 검정
6) 분류된 자료 분석
. 모든 정규분포는 관측치의 68.3%는 평균에서 아래 위로 1 표준편차 이내에 위치
95.4%는 평균에서 아래 위로 2 표준편차
99.7%는 평균에서 아래 위로 3 표준편차
. 표준정규분포: 정규확률변수 X를 평균에서 떨어진 거리에 대한 표준편차의 비로 변환.
Z=
{ X- mu } over { sigma }
. 정규분포가 아닌 확률분포가 정규분포와 유사한 분포화를 보이는 것을 정규근사.
.
2.표본분포와 추정
1) 통계적 추론의 논리적 근거
2) 왜 표본분포를 알아야 하는가
. 표본추출변동 : 통계량들은 추출된 표본마다 다른 값을 나타낼 수 있다.
. 표본분포: 표본통계량들이 나타내는 확률분포. 통계적 추론의 출발이 표본통계이므로
표본통계량의 확률분포인 표본분포를 아는 것이 필수.
3) 중심극한 정리
. 모집단이 정규분포를 하지 않는 경우에도 표본의 크기가 충분히 크면 표본평균의
분포는 근사적으로 정규분포를 한다. Z=
{ X - mu } over { sigma / sqrt { n } }
4) 표본분포에는 어떤 것들이 있는가
. 정규분포 아니지만 정규분포를 하는 모집단에서 추출한 표본에 적용되는 t분포와 카이 제곱 분포.
. t분포: 모표준편차를 모를 때 모평균 추정(n<30).
모표준편차S=
sqrt { { sum from { } to { } { (X_{ i } - bar { X } )^{ 2 } } } over { n-1 } }
T=
{ bar { X } - mu } over { S/ sqrt { n } }
- 자유도(독자적으로 변수값을 가질 수 있는 측정치의 갯수)가 작을수록 모양이 납 작해지고, 클수록 표준정규분포에 가까워진다.
. 카이제곱분포: 모분산에 대해서 통계적 추론. V=
{ (n-1)S^{ 2 } } over { sigma ^{ `^{ 2 } } }
- 자유도 작을수록 오른쪽 긴꼬리, 클수록 대칭형태.
5) 좋은 추정의 조건
. 추정통계량의 표준편차를 표준오차
. 최소분산불편추정법 : 불편(偏)추정통계량(평균이 추정하려는 모수)이면서 표준오차가 작은 비뚤린추정통계량 것을 택할수록좋은추정
6) 신뢰구간이란
. 점추정 : 모수를 하나의 수치로 추정하는 것.
. 신뢰구간 : 모수가 위치할 어떤 구간.
. 신뢰수준: 신뢰구간이 모평균을 포함한다는 사실의 믿음 정도
. 모평균에 대한 95%신뢰수간은 구간추정 무한반복으로 구해진 신뢰구간의 95%에서
모평균을 포함하게 될 것이라는 의미.
. 신뢰구간의 범위는 Z값과 모표준편차에 의해 결정.(Z크고 클수록 큰 신뢰구간)
. 오차한계 : Z
7) 표본분포가 어떻게 추정에 이용될 수 있는가
. 모평균 추정
. 모분율 추정
. 모분산 추정
3. 가설검정의 원리
- 가설검정 : 모수에 관한 가설의 타당성 영부를 판정하는 과정.
- 모수검정 : 모집단의 확률분포 및 그로부터 유도된 표본분포 이용하는 통계적 가설검정
1) 귀무가설과 대립가설
- 대립가설 : 주창자가 타당성을 입증하고자 하는 가설(
H_{ 1 } )
- 귀무가설 : 대립가설에 반대되는 가설(
H_{ 0 } )
2) 가설검정의 오류
. 1종 오류( 오류): 귀무가설이 참인데 기각 위양성(false positive)
. 2종 오류( 오류): 귀무가설이 참이 아닌데 기각하지 못함 위음성(false negative)
3) p값
. 유의수준 값:
. p값(외부확률) : 임의의 자료가 분포에서 양 꼬리쪽으로 치우친 어떤값보다 크거나 작을 확률의 크기 (95% p=0.05)
4) 어떻게 가설검정의 원칙을 세울 수 있는가
. p값이 유의수준보다 작거나 같으면 귀무가설 기각!
1종 오류를 p값만큼 감수.
. 정규검정법(Z검정) : p,Z를 이용한 검정법
. t검정법 : 검정통계량으로 확률변수 T를 이용한 검정법
가설검정 단계
① 귀무가설, 대립가설 설정
② 유의수준
③ 검정통계량 설정
④ 표본에서 p값 계산하여 p= 되는 값 구한다.
⑤ p가 보다 작으면 유의수준 에서 귀무가설 기각
5) 기각역, 단측 및 양측검정
. 임계값 : p= 가 되는 검정통계량의 절대값
. 기각역 : 귀무가설을 기각할 수 있게 해주는 검정통계량 값의 영역
. 양측검정 : 기각역 및 p값이 귀무가설 하에서 분포의 양 꼬리 쪽을 가리킴
6) 가설검정의 오용
tf gv
4. 흔히 사용되는 통계적 분석방법
1) 모평균 비교
2) 모평균 차이 검정
3) 짝짓기
4) 단측검정, 양측검정
5) 모분율 차이 검정
6) 분류된 자료 분석
추천자료
- 통계와 히스토그램 수업자료
- 통신 언어의 자료를 직접 수집&#8228;조사하여 분석해 보시오.
- 교재 1장을 참고하여, 통신 언어의 자료를 직접 수집하여 각 예들에서 어떤 표현적 장치가 사...
- [언어와 생활 공통] 교재 1장을 참고하여, 통신 언어의 특징을 보이는 자료를 직접 수집ㆍ조...
- [언어와 생활 공통] 교재 1장을 참고하여, 통신 언어의 특징을 보이는 자료를 직접 수집ㆍ조...
- [언어와 생활 공통] 교재 1장을 참고하여, 통신 언어의 특징을 보이는 자료를 직접 수집ㆍ조...
- 통계의 오류, 숫자의 허점 - 이명박 정부의 복지정책과 성과를 중심으로 (이명박 정부의 복지...
- [지역사회영양학] 성인, 직장인 대상 보건영양사업 (성인직장인보건문제, 국민건강통계, 근로...
- [사회복지 정책론] 한국 사회에 복지국가가 필요한 10가지 이유를 책 참조하여 정리 & 다...
- [★PPT발표자료★][Drug Abuse] 약물남용의 실태, 원인, 약남 남용 통계, 약물 남용 심각성 및 ...
- 2016년 1학기 언어와생활 중간시험과제물 공통(통신언어의 특징 자료 수집 조사 분석)
- [언어와 생활 공통] 교재 1장을 참고하여, 통신 언어의 특징을 보이는 자료를 직접 수집ㆍ조...
- (언어와생활 공통) 교재 1장을 참고하여, 통신 언어의 특징을 보이는 자료를 직접 수집ㆍ조...
- [언어와 생활 공통] 교재 1장을 참고하여 통신 언어의 특징을 보이는 자료를 직접 수집ㆍ조사...