목차
1. t검정
1) 단일 평균검정
2) 두 평균 간 차이의 검정
- t검정의 예
2. 분산분석
1) 일원분산분석(one-way ANOVA)
2) 이원분산분석(two-way ANOVA)
- 분산분석의 예
3. 교차분석
-교차분석의 예
4. 상관분석
- 상관분석의 예
5. 회귀분석
- 회귀분석의 예
1) 단일 평균검정
2) 두 평균 간 차이의 검정
- t검정의 예
2. 분산분석
1) 일원분산분석(one-way ANOVA)
2) 이원분산분석(two-way ANOVA)
- 분산분석의 예
3. 교차분석
-교차분석의 예
4. 상관분석
- 상관분석의 예
5. 회귀분석
- 회귀분석의 예
본문내용
, 2=B 라고 하는 변수값 설명을 해놓는다.
“인지”라는 변수에는 1=모른다, 2=알고 있다 라고 하는 변수값 설명을 해 놓는다.
“사람 수” 라는 변수는 빈도변수라고 하는 것을 지정해 놓는다.
P값 = 0.285 > 유의수준 = 0.05
이므로 귀무가설은 기각되지 않는다. 즉, A그룹과 B그룹의 모인지율에 차 가 있다고 할 수 없다.
4. 상관분석
둘 또는 그 이상의 변수들에 있어서 한 변수가 변동함에 따라 다른 변수가 어 떻게 변동하는 것과 같은 변동의 연관성 정도, 변동의 크기의 정도와 방향을 분석하는 방법을 말한다. 즉, 한 변수가 커지거나(높아지거나) 작아질(낮아질) 때, 다른 변수가 어떻게 변하는지를 그 변동의 정도와 방향을 예측하여 알려주 는 분석 방법이다. 상관분석은 한 변수의 분산 중에서 다른 변수와 같이 변화 하는 분산, 즉, 공분산이 어느 정도 되는가에 따라 결정된다고 볼 수 있다. 변 화하는 공분산이 클수록 직선에 가깝게 되고, 그렇게 되면 상관관계는 높아진 다고 불 수 있다.
상관분석에서 변수간의 관계의 정도와 방향을 하나의 수치로 요약해 표시해 주는 지수를 상관계수라 한다. 이 관계의 정도는 수치의 0에서 1사이의 절대값 으로 나타낸다. 즉, 상관계수는 -1.00에서 0, 0에서 +1.00사이의 값을 취하게 된다. 이때 0에 가까울수록 상관관계는 낮아지는 것이며, 절대값이 1에 가까워 질수록 상관관계는 높아지는 것이다. 변수 관계의 방향은 -,+로 표현하고, 관계 의 방향에 따라 한쪽이 증가할 때 다른 쪽도 증가하게 되는 관계, 즉, 증감의 방향이 같은 경우 +의(양, 정적인) 상관관계가 있는 것이며, 한쪽이 감소할 때, 다른 쪽이 증가하게 되는 관계, 즉, 증감의 방향이 반대인 경우 -의(음, 부적 인) 상관관계가 있는 것으로 불 수 있다.
상관분석에서는 해석과 조사 결과의 가치에 따라 상관관계를 파악해야 한다. 그러나 직접적인 연관성이 없는 것이 상관관계가 높다고 무조건 의미 있는 것 으로 해석하는 것도 위험할 수 있다. 이는 변수와 변수와의 관련성의 논리적 연관성도 무시할 수 없기 때문이다.
- 상관분석의 예
다음의 데이터는 건물을 짓는데 사용되는 시멘트의 강도(y)와 그 시멘트중 에 포함된 경화제의 양(x)을 30개 측정한 것이다. 이 데이터를 토대로 경 화제의 양 x와 강도 y의 관계를 알아보자.
No.
1
2
3
4
5
6
7
8
9
10
경화제의 양(x)
29
32
29
28
25
28
31
31
32
23
강도(y)
50
49
46
51
44
46
52
52
51
42
No.
11
12
13
14
15
16
17
18
19
20
경화제의 양(x)
29
32
27
30
29
29
30
30
32
29
강도(y)
46
52
47
53
51
51
53
53
54
47
No.
21
22
23
24
25
26
27
28
29
30
경화제의 양(x)
29
29
28
28
26
31
26
33
27
32
강도(y)
50
53
49
46
47
53
45
48
47
48
우선 강도와 경화제의 양, 즉 두 변수의 연관성을 파악하는 것이므로 상관 분석을 사용한다.
Pearson Correlation : 피어슨의 적률 상관관계 계수를 나타낸다.
Sig : 상관관계의 유의도를 나타낸다.
N : 분석에 사용된 사례수를 나타낸다.
x(경화제의 양)과 y(강도)는 상당히 강한 양의 상관관계(0.681)를 가지고 있으며, 통계적으로 매우 유의하다.
<산점도 작성>
5. 회귀분석
회귀분석은 변수 상호간의 관계를 표본으로부터 추정하는 방법으로 특정변수 (종속변수, 반응변수)가 다른 변수(독립변수, 설명변수)에 의해 어떻게 설명 또 는 예측되는지를 파악하는 통계적 분석 방법이다. 회귀분석에 필요한 자료는 종속변수, 독립변수 모두 연속형 자료이다. 단, 범주형 자료는 더미변수를 이용 하면 사용이 가능하다. 회귀모형은 독립변수의 수에 따라 구분되는데, 독립변 수가 1개인 경우의 회귀모형을 단순회귀모형, 2개 이상인 경우를 중회귀모형이 라 한다.
회귀분석은 회귀방정식(y=Bx+A)이라고 하는 직선의 방정식을 구하는 것이 다. 즉, 회귀분석은 독립변수(x)에 의하여 생기는 종속변수(y)변수의 변화에 관 심을 갖기 때문에 기울기 B와 Y절편 A의 값을 구하는 것이다.
독립변수와 종속변수의 분포에서 실제 분포된 종속변수의 값들로부터 가장 오 차가 적은(이탈의 합이 가장 적은) 직선을 찾아내는 과정(최소자승법)을 거치 며, 이 최적의 직선을 y=Bx+A와 같은 방정식의 형태로 표현할 수 있다. 회귀 분석에서는 다음과 같은 조건을 만족시켜야한다. 첫째, 주어진 자료에서 독립 변수와 종속변수의 값의 분포가 직선적인 관계(선형성)이어야 한다. 둘째, 오차 들이 서로 독립적이어야 한다. 셋째, 이 오차들의 분산(변량)이 모두 일정해야 한다. 넷째, 이 오차들의 분포가 정상분포어야 한다.
- 회귀분석의 예
다음의 데이터는 회사에 근무하는 20명의 판매원에 대한 판매활동의 적성을 보는 시험의 득점(x)과 일정기간에 있어서의 판매실적(y)을 나타낸 것이다.
No.
1
2
3
4
5
6
7
8
9
10
x
41
35
34
40
33
42
37
42
30
43
y
32
20
35
24
27
28
31
33
26
41
No.
11
12
13
14
15
16
17
18
19
20
x
38
38
46
36
32
43
42
30
41
45
y
29
33
36
23
22
38
26
20
30
30
적성시험의 득점(x)과 판매실적(y)의 유의성을 검증하여보자.
y(판매실적)의 평균이 29.2, 표준편차는 5.85437이고 x(시험득점)의 평균은 38.4, 표준편차는 4.86015를 나타내고 있다. 변수별 사례수는 각각 20임을 나타내고 있다.
y(판매실적)과 x(시험득점)간의 상관계수는 0.609이고, 두 변수의 상관관계 는 유의하다.(p=0.002)
회귀식의 상수값은 1.016이며 x의 회귀계수는 0.734이다. 회귀계수의 유의 성을 검정하는 t값 3.260의 확률적 표시인 유의확률이 0.004이므로, 유의수준 = 0.05에서 이 회귀계수는 통계적으로 매우 유의하다고 볼 수 있 다.
“인지”라는 변수에는 1=모른다, 2=알고 있다 라고 하는 변수값 설명을 해 놓는다.
“사람 수” 라는 변수는 빈도변수라고 하는 것을 지정해 놓는다.
P값 = 0.285 > 유의수준 = 0.05
이므로 귀무가설은 기각되지 않는다. 즉, A그룹과 B그룹의 모인지율에 차 가 있다고 할 수 없다.
4. 상관분석
둘 또는 그 이상의 변수들에 있어서 한 변수가 변동함에 따라 다른 변수가 어 떻게 변동하는 것과 같은 변동의 연관성 정도, 변동의 크기의 정도와 방향을 분석하는 방법을 말한다. 즉, 한 변수가 커지거나(높아지거나) 작아질(낮아질) 때, 다른 변수가 어떻게 변하는지를 그 변동의 정도와 방향을 예측하여 알려주 는 분석 방법이다. 상관분석은 한 변수의 분산 중에서 다른 변수와 같이 변화 하는 분산, 즉, 공분산이 어느 정도 되는가에 따라 결정된다고 볼 수 있다. 변 화하는 공분산이 클수록 직선에 가깝게 되고, 그렇게 되면 상관관계는 높아진 다고 불 수 있다.
상관분석에서 변수간의 관계의 정도와 방향을 하나의 수치로 요약해 표시해 주는 지수를 상관계수라 한다. 이 관계의 정도는 수치의 0에서 1사이의 절대값 으로 나타낸다. 즉, 상관계수는 -1.00에서 0, 0에서 +1.00사이의 값을 취하게 된다. 이때 0에 가까울수록 상관관계는 낮아지는 것이며, 절대값이 1에 가까워 질수록 상관관계는 높아지는 것이다. 변수 관계의 방향은 -,+로 표현하고, 관계 의 방향에 따라 한쪽이 증가할 때 다른 쪽도 증가하게 되는 관계, 즉, 증감의 방향이 같은 경우 +의(양, 정적인) 상관관계가 있는 것이며, 한쪽이 감소할 때, 다른 쪽이 증가하게 되는 관계, 즉, 증감의 방향이 반대인 경우 -의(음, 부적 인) 상관관계가 있는 것으로 불 수 있다.
상관분석에서는 해석과 조사 결과의 가치에 따라 상관관계를 파악해야 한다. 그러나 직접적인 연관성이 없는 것이 상관관계가 높다고 무조건 의미 있는 것 으로 해석하는 것도 위험할 수 있다. 이는 변수와 변수와의 관련성의 논리적 연관성도 무시할 수 없기 때문이다.
- 상관분석의 예
다음의 데이터는 건물을 짓는데 사용되는 시멘트의 강도(y)와 그 시멘트중 에 포함된 경화제의 양(x)을 30개 측정한 것이다. 이 데이터를 토대로 경 화제의 양 x와 강도 y의 관계를 알아보자.
No.
1
2
3
4
5
6
7
8
9
10
경화제의 양(x)
29
32
29
28
25
28
31
31
32
23
강도(y)
50
49
46
51
44
46
52
52
51
42
No.
11
12
13
14
15
16
17
18
19
20
경화제의 양(x)
29
32
27
30
29
29
30
30
32
29
강도(y)
46
52
47
53
51
51
53
53
54
47
No.
21
22
23
24
25
26
27
28
29
30
경화제의 양(x)
29
29
28
28
26
31
26
33
27
32
강도(y)
50
53
49
46
47
53
45
48
47
48
우선 강도와 경화제의 양, 즉 두 변수의 연관성을 파악하는 것이므로 상관 분석을 사용한다.
Pearson Correlation : 피어슨의 적률 상관관계 계수를 나타낸다.
Sig : 상관관계의 유의도를 나타낸다.
N : 분석에 사용된 사례수를 나타낸다.
x(경화제의 양)과 y(강도)는 상당히 강한 양의 상관관계(0.681)를 가지고 있으며, 통계적으로 매우 유의하다.
<산점도 작성>
5. 회귀분석
회귀분석은 변수 상호간의 관계를 표본으로부터 추정하는 방법으로 특정변수 (종속변수, 반응변수)가 다른 변수(독립변수, 설명변수)에 의해 어떻게 설명 또 는 예측되는지를 파악하는 통계적 분석 방법이다. 회귀분석에 필요한 자료는 종속변수, 독립변수 모두 연속형 자료이다. 단, 범주형 자료는 더미변수를 이용 하면 사용이 가능하다. 회귀모형은 독립변수의 수에 따라 구분되는데, 독립변 수가 1개인 경우의 회귀모형을 단순회귀모형, 2개 이상인 경우를 중회귀모형이 라 한다.
회귀분석은 회귀방정식(y=Bx+A)이라고 하는 직선의 방정식을 구하는 것이 다. 즉, 회귀분석은 독립변수(x)에 의하여 생기는 종속변수(y)변수의 변화에 관 심을 갖기 때문에 기울기 B와 Y절편 A의 값을 구하는 것이다.
독립변수와 종속변수의 분포에서 실제 분포된 종속변수의 값들로부터 가장 오 차가 적은(이탈의 합이 가장 적은) 직선을 찾아내는 과정(최소자승법)을 거치 며, 이 최적의 직선을 y=Bx+A와 같은 방정식의 형태로 표현할 수 있다. 회귀 분석에서는 다음과 같은 조건을 만족시켜야한다. 첫째, 주어진 자료에서 독립 변수와 종속변수의 값의 분포가 직선적인 관계(선형성)이어야 한다. 둘째, 오차 들이 서로 독립적이어야 한다. 셋째, 이 오차들의 분산(변량)이 모두 일정해야 한다. 넷째, 이 오차들의 분포가 정상분포어야 한다.
- 회귀분석의 예
다음의 데이터는 회사에 근무하는 20명의 판매원에 대한 판매활동의 적성을 보는 시험의 득점(x)과 일정기간에 있어서의 판매실적(y)을 나타낸 것이다.
No.
1
2
3
4
5
6
7
8
9
10
x
41
35
34
40
33
42
37
42
30
43
y
32
20
35
24
27
28
31
33
26
41
No.
11
12
13
14
15
16
17
18
19
20
x
38
38
46
36
32
43
42
30
41
45
y
29
33
36
23
22
38
26
20
30
30
적성시험의 득점(x)과 판매실적(y)의 유의성을 검증하여보자.
y(판매실적)의 평균이 29.2, 표준편차는 5.85437이고 x(시험득점)의 평균은 38.4, 표준편차는 4.86015를 나타내고 있다. 변수별 사례수는 각각 20임을 나타내고 있다.
y(판매실적)과 x(시험득점)간의 상관계수는 0.609이고, 두 변수의 상관관계 는 유의하다.(p=0.002)
회귀식의 상수값은 1.016이며 x의 회귀계수는 0.734이다. 회귀계수의 유의 성을 검정하는 t값 3.260의 확률적 표시인 유의확률이 0.004이므로, 유의수준 = 0.05에서 이 회귀계수는 통계적으로 매우 유의하다고 볼 수 있 다.
추천자료
- [병원통계] 병원통계 (통계월보 : 건강지표, 생명표, 사망률, 영아사망률 등)
- 고등학교 확률과 통계 단원의 특징, 고등학교 확률과 통계 단원의 동향과 내용, 고등학교 확...
- [문화산업]문화산업의 현황 통계, 문화산업의 영화산업 통계, 문화산업의 애니메이션산업 통...
- [통계학][통계학 종류][통계학 활용실태][통계학 모집단][통계학 표본][통계학 변수][통계학 ...
- [교육통계][교육통계의 기초][교육통계의 이론][교육통계의 수집][교육통계의 분석][교육통계...
- [노동시장 통계][고용][임금][이동][근로시간][산재(산업재해)][파견근무]노동시장 고용 통계...
- [통계][통계 집중화경향][통계 측정신뢰성][통계 측정타당성][통계학 활용방안]통계의 정의, ...
- 한국(우리나라) 출생 통계, 한국(우리나라) 혼인과 이혼 통계, 한국(우리나라) 가족 통계, 한...
- [통계지도][통계교육]통계지도(통계교육)의 정의, 통계지도(통계교육)의 수업과정, 통계지도(...
- [통계][표본크기][추정][신뢰구간][회귀분석][통계 활용사례]통계의 종류, 통계의 특성, 통계...
- [통계]한국(우리나라)의 국민계정 통계, 한국(우리나라)의 문화 통계, 한국(우리나라)의 산업...
- 우리나라의 혼인 통계, 우리나라의 경제 통계, 우리나라의 복지 통계, 우리나라의 사망 통계,...
- [공업통계학][통계학][통계학 제 개념][공업통계학 추정][공업통계학 가설검정][공업통계학 ...
- [생산변동][생산][생산지수변동][생산통계변동][생산가격변동][생산성변동][생산지수][생산통...
소개글