회귀분석
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
해당 자료는 10페이지 까지만 미리보기를 제공합니다.
10페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

회귀분석에 대한 보고서 자료입니다.

목차

제 1 장 통계적 가설검정에 대하여

제 2 장 단순회귀분석

제 3 장 단순회귀에 관한 추론

제 4 장 중회귀분석

제 5 장 중회귀분석의 추론

제 6 장 다항회귀 및 가변수

제 7 장 회귀모형의 진단 및 처방 I

제 8 장 회귀모형의 진단 및 처방 II

제 9 장 최적 회귀방정식의 선택

제10 장 회귀분석의 기타 논제

본문내용

수(logistic function)라 부르고,
z`` =`` beta_0 + beta_1` x `
라 놓을 때
E(y)``=``{exp(z)} over{1+exp(z)}`
또는
1 over {1+exp(-z)}`
으로 표현된다. 이 값은 어떤 사건이 일어날 확률로 해석할 수 있다. 로지스틱 회귀분석(logistic regression)이란 단지 두 개의 값만을 가지는 종속변수(예를 들면, 주택유무, 보험가입 여부 등)와 독립변수들 간의 인과관계를 로지스틱 함수를 이용하여 추정하는 통계기법이다.
로지스틱 회귀모형이 이용되는 예는 다음과 같다.
예1) 페놀용액이 물고기의 생존여부에 미치는 영향을 조사하고자 할 때, 농도 X 인 페놀용액에 물고기를 넣어서 일정시간 지난 후의 물고기의 생존여부(y)를 생존=1, 사망=2 로 하는 경우
예2) 월수입 X 인 소비자가 어떤 전자제품을 구입할 것인지의 관계를 규명하고자 할때, 구입의사(y)가 있으면 1로, 없으면 2 로 하는 경우
<그림 10.1> 로지스틱 함수
로지스틱 반응함수는
beta_0`

beta_1`
에 대하여 비선형함수이나 이를 선형으로 변환시킬 수 있다. 기대반응
E(y)`
는 확률을 의미하므로
E(y) ``=`` p_x`
로 놓자. 그러면 다음의 변환
ln( {p_x} over {1-p_x})``=``z``=``beta_0 +beta_1`x`
(
Lrarrow ~~p = { exp (beta_0 + beta_1 x ) } over { 1 + exp (beta_0 + beta_1 x ) }
)
을 통하여 선형화된다. 이와같은 변환을 로지스틱변환(logistic transformation)이라고 부른다.
독립변수의 수가 두 개 이상인 경우에도 로지스틱 회귀모형이 가능하다. 이 경우에는
z`` =`` beta_0 + beta_1 `x_1 +beta_2 `x_2 +cdots+beta_p `x_p`
로 나타내고, 이
z`
를 로지스틱 회귀모형에 대입시키면 된다.
2) 분석 예
교재 303쪽의 예를 이용하여 로지스틱 회귀분석을 위한 SAS 저라를 살펴보도록 하자. SAS에서 로지스틱 회귀분석의 프로시져는 PROC LOGISTIC 또는 CATMOD 가 있다. 여러분 교재에서는 CATMOD를 이용한 분석 프로그램을 소개하고 있으나, 교재의 데이터와 같은 경우에는 LOGISTIC 절차가 더 간편하다.
다음 프로그램은 PROC LOGISTIC 과 CATMOD를 이용한 프로그램의 예이다.
data ex102; ;
input x buyer total;
cards;
5 64 400
10 80 400
15 100 400
20 180 400
30 276 400
40 315 400
50 330 400
run;
/* PROC LOGISTIC */
proc logistic data = ex102;
model buyer/total = x;
run;
/* Generate DATA set for CATMOD */
data logit;
set ex102;
y = 1; count=buyer; output;
y = 2; count=total-buyer; output;
run;
/* PROC CATMOD */
proc catmod data=logit;
direct x;
weight count;
model y =x;
run;
참고: PROC CATMOD에서 direct x 의 의미는 변수 x가 연속변수라는 것을 나타냄.

Analysis of Maximum Likelihood Estimates
Parameter Standard Wald Pr > Standardized Odds
Variable DF Estimate Error Chi-Square Chi-Square Estimate Ratio
INTERCPT 1 -2.0318 0.0887 524.7675 0.0001 . .
X 1 0.0815 0.00332 601.9175 0.0001 0.683928 1.085

ANALYSIS OF MAXIMUM-LIKELIHOOD ESTIMATES
Standard Chi-
Effect Parameter Estimate Error Square Prob
----------------------------------------------------------------
INTERCEPT 1 -2.0318 0.0887 524.77 0.0000
X 2 0.0815 0.00332 601.92 0.0000
===> 위 출력결과에서 로지스틱 회귀모형은
ln ( p over {1-p} ) = -2.0318 + 0.0815 x
이 된다.
참고: 교재 307쪽 출력결과가 잘못되었음.
[연습문제 2번풀이]
data ex102; ;
input x r n;
p = r/n;
lp = ln(p/(1-p));
cards;
1 29 250
2 80 400
3 180 500
4 190 450
5 185 300
6 150 200
run;
/* Scatterplot of logit*x */
proc gplot;
plot lp*p;
run;
/* PROC LOGISTIC */
proc logistic data = ex102;
model r/n = x;
run;
1)
ln( hat p / (1- hat p) )
과 x 의 산점도:
참고: 위 그림은 SPSS를 이용하여 그린 그림으로서, SAS의 경우도 동일함.
2) 로지스틱 회귀분석 결과(일부)
Analysis of Maximum Likelihood Estimates
Parameter Standard Wald Pr > Standardized Odds
Variable DF Estimate Error Chi-Square Chi-Square Estimate Ratio
INTERCPT 1 -2.5359 0.1379 338.0559 0.0001 . .
X 1 0.5965 0.0360 274.9524 0.0001 0.485867 1.816
===> 위 출력결과에서 로지스틱 회귀모형은
ln ( p over {1-p} ) = -2.5359 + 0.5965 x
이 된다.

키워드

  • 가격1,000
  • 페이지수56페이지
  • 등록일2003.11.22
  • 저작시기2003.11
  • 파일형식한글(hwp)
  • 자료번호#234113
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니