-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
-
13
-
14
-
15
-
16
-
17
-
18
-
19
-
20
-
21
-
22
-
23
-
24
-
25
-
26
-
27
-
28
-
29
-
30
-
31
-
32
-
33
-
34
-
35
-
36
-
37
-
38
-
39
-
40
-
41
-
42
-
43
-
44
-
45
-
46
-
47
-
48
-
49
-
50
-
51
-
52
-
53
-
54
-
55
-
56
목차
제 1 장 통계적 가설검정에 대하여
제 2 장 단순회귀분석
제 3 장 단순회귀에 관한 추론
제 4 장 중회귀분석
제 5 장 중회귀분석의 추론
제 6 장 다항회귀 및 가변수
제 7 장 회귀모형의 진단 및 처방 I
제 8 장 회귀모형의 진단 및 처방 II
제 9 장 최적 회귀방정식의 선택
제10 장 회귀분석의 기타 논제
제 2 장 단순회귀분석
제 3 장 단순회귀에 관한 추론
제 4 장 중회귀분석
제 5 장 중회귀분석의 추론
제 6 장 다항회귀 및 가변수
제 7 장 회귀모형의 진단 및 처방 I
제 8 장 회귀모형의 진단 및 처방 II
제 9 장 최적 회귀방정식의 선택
제10 장 회귀분석의 기타 논제
본문내용
수(logistic function)라 부르고,
z`` =`` beta_0 + beta_1` x `
라 놓을 때
E(y)``=``{exp(z)} over{1+exp(z)}`
또는
1 over {1+exp(-z)}`
으로 표현된다. 이 값은 어떤 사건이 일어날 확률로 해석할 수 있다. 로지스틱 회귀분석(logistic regression)이란 단지 두 개의 값만을 가지는 종속변수(예를 들면, 주택유무, 보험가입 여부 등)와 독립변수들 간의 인과관계를 로지스틱 함수를 이용하여 추정하는 통계기법이다.
로지스틱 회귀모형이 이용되는 예는 다음과 같다.
예1) 페놀용액이 물고기의 생존여부에 미치는 영향을 조사하고자 할 때, 농도 X 인 페놀용액에 물고기를 넣어서 일정시간 지난 후의 물고기의 생존여부(y)를 생존=1, 사망=2 로 하는 경우
예2) 월수입 X 인 소비자가 어떤 전자제품을 구입할 것인지의 관계를 규명하고자 할때, 구입의사(y)가 있으면 1로, 없으면 2 로 하는 경우
<그림 10.1> 로지스틱 함수
로지스틱 반응함수는
beta_0`
와
beta_1`
에 대하여 비선형함수이나 이를 선형으로 변환시킬 수 있다. 기대반응
E(y)`
는 확률을 의미하므로
E(y) ``=`` p_x`
로 놓자. 그러면 다음의 변환
ln( {p_x} over {1-p_x})``=``z``=``beta_0 +beta_1`x`
(
Lrarrow ~~p = { exp (beta_0 + beta_1 x ) } over { 1 + exp (beta_0 + beta_1 x ) }
)
을 통하여 선형화된다. 이와같은 변환을 로지스틱변환(logistic transformation)이라고 부른다.
독립변수의 수가 두 개 이상인 경우에도 로지스틱 회귀모형이 가능하다. 이 경우에는
z`` =`` beta_0 + beta_1 `x_1 +beta_2 `x_2 +cdots+beta_p `x_p`
로 나타내고, 이
z`
를 로지스틱 회귀모형에 대입시키면 된다.
2) 분석 예
교재 303쪽의 예를 이용하여 로지스틱 회귀분석을 위한 SAS 저라를 살펴보도록 하자. SAS에서 로지스틱 회귀분석의 프로시져는 PROC LOGISTIC 또는 CATMOD 가 있다. 여러분 교재에서는 CATMOD를 이용한 분석 프로그램을 소개하고 있으나, 교재의 데이터와 같은 경우에는 LOGISTIC 절차가 더 간편하다.
다음 프로그램은 PROC LOGISTIC 과 CATMOD를 이용한 프로그램의 예이다.
data ex102; ;
input x buyer total;
cards;
5 64 400
10 80 400
15 100 400
20 180 400
30 276 400
40 315 400
50 330 400
run;
/* PROC LOGISTIC */
proc logistic data = ex102;
model buyer/total = x;
run;
/* Generate DATA set for CATMOD */
data logit;
set ex102;
y = 1; count=buyer; output;
y = 2; count=total-buyer; output;
run;
/* PROC CATMOD */
proc catmod data=logit;
direct x;
weight count;
model y =x;
run;
참고: PROC CATMOD에서 direct x 의 의미는 변수 x가 연속변수라는 것을 나타냄.
Analysis of Maximum Likelihood Estimates
Parameter Standard Wald Pr > Standardized Odds
Variable DF Estimate Error Chi-Square Chi-Square Estimate Ratio
INTERCPT 1 -2.0318 0.0887 524.7675 0.0001 . .
X 1 0.0815 0.00332 601.9175 0.0001 0.683928 1.085
ANALYSIS OF MAXIMUM-LIKELIHOOD ESTIMATES
Standard Chi-
Effect Parameter Estimate Error Square Prob
----------------------------------------------------------------
INTERCEPT 1 -2.0318 0.0887 524.77 0.0000
X 2 0.0815 0.00332 601.92 0.0000
===> 위 출력결과에서 로지스틱 회귀모형은
ln ( p over {1-p} ) = -2.0318 + 0.0815 x
이 된다.
참고: 교재 307쪽 출력결과가 잘못되었음.
[연습문제 2번풀이]
data ex102; ;
input x r n;
p = r/n;
lp = ln(p/(1-p));
cards;
1 29 250
2 80 400
3 180 500
4 190 450
5 185 300
6 150 200
run;
/* Scatterplot of logit*x */
proc gplot;
plot lp*p;
run;
/* PROC LOGISTIC */
proc logistic data = ex102;
model r/n = x;
run;
1)
ln( hat p / (1- hat p) )
과 x 의 산점도:
참고: 위 그림은 SPSS를 이용하여 그린 그림으로서, SAS의 경우도 동일함.
2) 로지스틱 회귀분석 결과(일부)
Analysis of Maximum Likelihood Estimates
Parameter Standard Wald Pr > Standardized Odds
Variable DF Estimate Error Chi-Square Chi-Square Estimate Ratio
INTERCPT 1 -2.5359 0.1379 338.0559 0.0001 . .
X 1 0.5965 0.0360 274.9524 0.0001 0.485867 1.816
===> 위 출력결과에서 로지스틱 회귀모형은
ln ( p over {1-p} ) = -2.5359 + 0.5965 x
이 된다.
z`` =`` beta_0 + beta_1` x `
라 놓을 때
E(y)``=``{exp(z)} over{1+exp(z)}`
또는
1 over {1+exp(-z)}`
으로 표현된다. 이 값은 어떤 사건이 일어날 확률로 해석할 수 있다. 로지스틱 회귀분석(logistic regression)이란 단지 두 개의 값만을 가지는 종속변수(예를 들면, 주택유무, 보험가입 여부 등)와 독립변수들 간의 인과관계를 로지스틱 함수를 이용하여 추정하는 통계기법이다.
로지스틱 회귀모형이 이용되는 예는 다음과 같다.
예1) 페놀용액이 물고기의 생존여부에 미치는 영향을 조사하고자 할 때, 농도 X 인 페놀용액에 물고기를 넣어서 일정시간 지난 후의 물고기의 생존여부(y)를 생존=1, 사망=2 로 하는 경우
예2) 월수입 X 인 소비자가 어떤 전자제품을 구입할 것인지의 관계를 규명하고자 할때, 구입의사(y)가 있으면 1로, 없으면 2 로 하는 경우
<그림 10.1> 로지스틱 함수
로지스틱 반응함수는
beta_0`
와
beta_1`
에 대하여 비선형함수이나 이를 선형으로 변환시킬 수 있다. 기대반응
E(y)`
는 확률을 의미하므로
E(y) ``=`` p_x`
로 놓자. 그러면 다음의 변환
ln( {p_x} over {1-p_x})``=``z``=``beta_0 +beta_1`x`
(
Lrarrow ~~p = { exp (beta_0 + beta_1 x ) } over { 1 + exp (beta_0 + beta_1 x ) }
)
을 통하여 선형화된다. 이와같은 변환을 로지스틱변환(logistic transformation)이라고 부른다.
독립변수의 수가 두 개 이상인 경우에도 로지스틱 회귀모형이 가능하다. 이 경우에는
z`` =`` beta_0 + beta_1 `x_1 +beta_2 `x_2 +cdots+beta_p `x_p`
로 나타내고, 이
z`
를 로지스틱 회귀모형에 대입시키면 된다.
2) 분석 예
교재 303쪽의 예를 이용하여 로지스틱 회귀분석을 위한 SAS 저라를 살펴보도록 하자. SAS에서 로지스틱 회귀분석의 프로시져는 PROC LOGISTIC 또는 CATMOD 가 있다. 여러분 교재에서는 CATMOD를 이용한 분석 프로그램을 소개하고 있으나, 교재의 데이터와 같은 경우에는 LOGISTIC 절차가 더 간편하다.
다음 프로그램은 PROC LOGISTIC 과 CATMOD를 이용한 프로그램의 예이다.
data ex102; ;
input x buyer total;
cards;
5 64 400
10 80 400
15 100 400
20 180 400
30 276 400
40 315 400
50 330 400
run;
/* PROC LOGISTIC */
proc logistic data = ex102;
model buyer/total = x;
run;
/* Generate DATA set for CATMOD */
data logit;
set ex102;
y = 1; count=buyer; output;
y = 2; count=total-buyer; output;
run;
/* PROC CATMOD */
proc catmod data=logit;
direct x;
weight count;
model y =x;
run;
참고: PROC CATMOD에서 direct x 의 의미는 변수 x가 연속변수라는 것을 나타냄.
Analysis of Maximum Likelihood Estimates
Parameter Standard Wald Pr > Standardized Odds
Variable DF Estimate Error Chi-Square Chi-Square Estimate Ratio
INTERCPT 1 -2.0318 0.0887 524.7675 0.0001 . .
X 1 0.0815 0.00332 601.9175 0.0001 0.683928 1.085
ANALYSIS OF MAXIMUM-LIKELIHOOD ESTIMATES
Standard Chi-
Effect Parameter Estimate Error Square Prob
----------------------------------------------------------------
INTERCEPT 1 -2.0318 0.0887 524.77 0.0000
X 2 0.0815 0.00332 601.92 0.0000
===> 위 출력결과에서 로지스틱 회귀모형은
ln ( p over {1-p} ) = -2.0318 + 0.0815 x
이 된다.
참고: 교재 307쪽 출력결과가 잘못되었음.
[연습문제 2번풀이]
data ex102; ;
input x r n;
p = r/n;
lp = ln(p/(1-p));
cards;
1 29 250
2 80 400
3 180 500
4 190 450
5 185 300
6 150 200
run;
/* Scatterplot of logit*x */
proc gplot;
plot lp*p;
run;
/* PROC LOGISTIC */
proc logistic data = ex102;
model r/n = x;
run;
1)
ln( hat p / (1- hat p) )
과 x 의 산점도:
참고: 위 그림은 SPSS를 이용하여 그린 그림으로서, SAS의 경우도 동일함.
2) 로지스틱 회귀분석 결과(일부)
Analysis of Maximum Likelihood Estimates
Parameter Standard Wald Pr > Standardized Odds
Variable DF Estimate Error Chi-Square Chi-Square Estimate Ratio
INTERCPT 1 -2.5359 0.1379 338.0559 0.0001 . .
X 1 0.5965 0.0360 274.9524 0.0001 0.485867 1.816
===> 위 출력결과에서 로지스틱 회귀모형은
ln ( p over {1-p} ) = -2.5359 + 0.5965 x
이 된다.
추천자료
- 청소년의 여가활동 실태분석및 문제점과 해결방안
- spss를 이용한 실업난 원인분석과 정책방안에 대한 연구
- 유한양행 경영 분석
- 전산통계학_이순신장군의 연승요인분석
- <마케팅조사론>상관관계분석의 의의
- 직무스트레스와 산출간 관계에서의 조직몰입의 조절역할, 분석 결과, 논의 및 결론
- 교통사고 발생건수에 영향을 미치는 요인 분석
- 진공 청소기의 선호도 및 음질 평가 분석
- (행정,통계)통계분석기법 용어정리
- 농산물가격론(고구마의_수요와_가격에_대한_분석)
- 계량경제학 실증분석-저축은행BIS비율관리에 대하여-
- 대한항공 재무분석
- 겟잇 뷰티 스타뷰티쇼 프로그램 비교분석
- 생산관리 15장.수요관리 예측 - 다양한 분석기법을 통한 생산관리.pptx
소개글