회귀분석실습.레포트제출
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

회귀분석실습.레포트제출에 대한 보고서 자료입니다.

본문내용

: 비선형회귀분석을 수행하는 프로시저.
proc glm : 일반선형모형에서 통계적 추론을 진행하는 프로시저.
-단순회귀분석
두 변수 사이에 존재하는 함수 관계 찾기.
독립변수가 종속변수에 영향을 미친다.
단순회귀분석으로 설명이 불가능할 때에는 다중회귀분석을 이용한다.
-모형
Yi = 종속 / 반응 / 내생 / 목적
Xi = 독립 / 요인 / 외생 / 입력
-오차항 기본 가정
정규성 :
독립성 :
등분산성 :
-SAS에서 사용하는 방법
[사용 확장자]
Data=one;
input x y @@;
cards;
11 2.5 13 2.7 14.5 2.9 12 2.5 17 4.1 16 4.0 15.5 3.8 14 3.0 13 2.9 18 4.2;
run;
proc print; run;
symbol interpol=RL c=black h=1 v=dot;
axis1 order=(10,13,16,19);
axis2 order=(2,3,4,5);
proc gplot data=one;
plot y*x/haxis=axis1 vaxis=axis2;
run;
proc reg data=one;
model y=x;
run;
<-Data 이름지정
<-x와 y로 변수 지정
<-자료 입력
<-입력한 자료를 출력
<-회귀직선을 interpol로 설정 후검은색, 1의 굵기, 점으로 표현
<-axis1,axis2에 각각 구간 설정
<-그래프 그리기에 one이란 data 소환
<-x와 y에 대한 그래프, haxis(x축)에 axis1 실행, vaxis(y축)에 axis2 실행.
<-회귀 프로시저 사용
<-model에는 종속변수 = 독립변수 형태로 사용
[결과]
위와 같은 결과표를 얻을 수 있습니다.
1. 회귀분석식 : 평균학점 = -0.9445+0.29198*입시성적
2. F값이 77.31이고 P-value값이 0.001 회귀모형의 적합성은
유의확률 Pr > F의 값 0.0001이므로 유의수준 0.05%에서 H0을 기각.
3. 위 과정으로 회귀모형이 적합하다고 판단.
4. R값이 0.902 종속변수에 관현 변동이 약 91%이므로
회귀모형 독립변수에 의해 영향을 받는다고 판단.
5. 추정
Parameter Estimates의 Intercept = B0 = -0.95(계수값)
0.0874(유의확률) 이므로 유의수준 0.05보다 크기 때문에 기각.
Parameter Estimates의 x = B1 = 0.29(계수값)
0.001(유의확률) 이므로 유의수준 0.05보다 작기 때문에 채택.
따라서, B1은 평균학점을 설명해주는 변수로 판단.
2. 과제
단순회귀분석에 사용할 수 있는 자료(40개 이상)를 찾아보기.
자료에 대한 설명과 분석방향 작성.
수업시간에 사용한 SAS처럼 활용해서 월요일(2012년 3월 19일 월요일 오후 5시까지 제출)
-자료설명
요즘은 컴퓨터 없이 살기 힘든 세상입니다. 인터넷 사용이 보급화 됨에 따라 항시 숨어있는 바이러스가 득실득실거리는 인터넷이 소중한 컴퓨터의 소프트웨어를 공격하고 이 누적된 데미지는 컴퓨터 손상에 이르러 그에 따른 수리비용이 발생할 것입니다. 물론 컴퓨터의 소프트웨어 수리에 인터넷의 사용이 얼마나 영향을 미치는지는 알 수 없지만 관계가 있을 것이라는 가정하에 자료를 선정하게 돼었습니다.
-분석방향
독립변수 : 인터넷 사용 시간(분) - 원인이 되는 요소이기 때문에 독립변수로 지정.
종속변수 : 소프트웨어 수리 비용(천원) - 확인하고픈 요소이기 때문에 종속변수로 지정.
-SAS 사용
[사용 확장자]
data one;input x y;cards;9.5 14814 8.4 17502 9.8 14007 11.0 19443 8.3 7573 9.9 14191 8.6 9714 6.4 8076 7.1 5304 8.2 10728 17.4 27243 15.0 25319 15.2 28028 16.4 31793 16.7 39499 15.4 25312 15.0 26222 14.8 26751 13.6 18036
25.6 56305 23.4 10417 24.4 52594 23.3 49512 19.5 32207 21.2 48218 22.8 50453 21.7 47661 19.8 38138 20.8 37045 15.3 29455 16.8 24865 16.7 10445 13.6 38562 25.6 57556 24.1 47661 22.7 38119 19.2 28025 15.7 11046 19.7 22485 22.5 47357 ;run;
proc print;run;
symbol1 interpol=RL c=black h=1 v=dot;
axis2 order=(8, 13, 18, 23, 28);
axis1 order=(10000,20000,30000,40000,50000,60000); proc gplot data=one;plot y*x / haxis=axis2 vaxis=axis1;run;
proc reg data=one; model y=x; run;
[결과 - 그래프]
위와 같이 그래프가 나왔습니다.
전반적으로 상승직선으로 나타난 것으로 보아
인터넷사용시간(분)이 컴퓨터 소프트웨어 수리 비용(천원)에 영향을 미치는 것으로 보여집니다.
[결과 - 회귀분석]
[분석]
모형의 적합성 판정
Analysis of Variance의 Pr > F(F값에 의한 P-value) < 0.0001 이므로 유의수준 0.05에서 H0을 기각.
회귀선
Analysis of Variance의 R-square = 0.6760 으로 약 68%의 회귀선을 설명.
추정
Parameter Estimates에서
Intercept(B0) = -7993.77722(계수값) / 0.0739(유의확률) 이 유의수준 0.05보다 크기 때문에 기각.
Parameter Esimates에서
x(B1) = 2219.68248(계수값) / 0.0001(유의확률)이 유의수준 0.05보다 작기 때문에 채택.
회귀분석식
Y(수리비용-천원단위)=-7993.72 + 22248 X(인터넷 사용시간-분단위) +
따라서
위와 같은 결과를 나타났기에
‘인터넷 사용시간이 컴퓨터 소프트웨어 수리 비용에 영향을 미칠 것이다.’ 라는
가정은 성립된다는 판단.

추천자료

  • 가격4,200
  • 페이지수10페이지
  • 등록일2012.12.05
  • 저작시기2012.3
  • 파일형식한글(hwp)
  • 자료번호#824110
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니