본문내용
: 비선형회귀분석을 수행하는 프로시저.
proc glm : 일반선형모형에서 통계적 추론을 진행하는 프로시저.
-단순회귀분석
두 변수 사이에 존재하는 함수 관계 찾기.
독립변수가 종속변수에 영향을 미친다.
단순회귀분석으로 설명이 불가능할 때에는 다중회귀분석을 이용한다.
-모형
Yi = 종속 / 반응 / 내생 / 목적
Xi = 독립 / 요인 / 외생 / 입력
-오차항 기본 가정
정규성 :
독립성 :
등분산성 :
-SAS에서 사용하는 방법
[사용 확장자]
Data=one;
input x y @@;
cards;
11 2.5 13 2.7 14.5 2.9 12 2.5 17 4.1 16 4.0 15.5 3.8 14 3.0 13 2.9 18 4.2;
run;
proc print; run;
symbol interpol=RL c=black h=1 v=dot;
axis1 order=(10,13,16,19);
axis2 order=(2,3,4,5);
proc gplot data=one;
plot y*x/haxis=axis1 vaxis=axis2;
run;
proc reg data=one;
model y=x;
run;
<-Data 이름지정
<-x와 y로 변수 지정
<-자료 입력
<-입력한 자료를 출력
<-회귀직선을 interpol로 설정 후검은색, 1의 굵기, 점으로 표현
<-axis1,axis2에 각각 구간 설정
<-그래프 그리기에 one이란 data 소환
<-x와 y에 대한 그래프, haxis(x축)에 axis1 실행, vaxis(y축)에 axis2 실행.
<-회귀 프로시저 사용
<-model에는 종속변수 = 독립변수 형태로 사용
[결과]
위와 같은 결과표를 얻을 수 있습니다.
1. 회귀분석식 : 평균학점 = -0.9445+0.29198*입시성적
2. F값이 77.31이고 P-value값이 0.001 회귀모형의 적합성은
유의확률 Pr > F의 값 0.0001이므로 유의수준 0.05%에서 H0을 기각.
3. 위 과정으로 회귀모형이 적합하다고 판단.
4. R값이 0.902 종속변수에 관현 변동이 약 91%이므로
회귀모형 독립변수에 의해 영향을 받는다고 판단.
5. 추정
Parameter Estimates의 Intercept = B0 = -0.95(계수값)
0.0874(유의확률) 이므로 유의수준 0.05보다 크기 때문에 기각.
Parameter Estimates의 x = B1 = 0.29(계수값)
0.001(유의확률) 이므로 유의수준 0.05보다 작기 때문에 채택.
따라서, B1은 평균학점을 설명해주는 변수로 판단.
2. 과제
단순회귀분석에 사용할 수 있는 자료(40개 이상)를 찾아보기.
자료에 대한 설명과 분석방향 작성.
수업시간에 사용한 SAS처럼 활용해서 월요일(2012년 3월 19일 월요일 오후 5시까지 제출)
-자료설명
요즘은 컴퓨터 없이 살기 힘든 세상입니다. 인터넷 사용이 보급화 됨에 따라 항시 숨어있는 바이러스가 득실득실거리는 인터넷이 소중한 컴퓨터의 소프트웨어를 공격하고 이 누적된 데미지는 컴퓨터 손상에 이르러 그에 따른 수리비용이 발생할 것입니다. 물론 컴퓨터의 소프트웨어 수리에 인터넷의 사용이 얼마나 영향을 미치는지는 알 수 없지만 관계가 있을 것이라는 가정하에 자료를 선정하게 돼었습니다.
-분석방향
독립변수 : 인터넷 사용 시간(분) - 원인이 되는 요소이기 때문에 독립변수로 지정.
종속변수 : 소프트웨어 수리 비용(천원) - 확인하고픈 요소이기 때문에 종속변수로 지정.
-SAS 사용
[사용 확장자]
data one;input x y;cards;9.5 14814 8.4 17502 9.8 14007 11.0 19443 8.3 7573 9.9 14191 8.6 9714 6.4 8076 7.1 5304 8.2 10728 17.4 27243 15.0 25319 15.2 28028 16.4 31793 16.7 39499 15.4 25312 15.0 26222 14.8 26751 13.6 18036
25.6 56305 23.4 10417 24.4 52594 23.3 49512 19.5 32207 21.2 48218 22.8 50453 21.7 47661 19.8 38138 20.8 37045 15.3 29455 16.8 24865 16.7 10445 13.6 38562 25.6 57556 24.1 47661 22.7 38119 19.2 28025 15.7 11046 19.7 22485 22.5 47357 ;run;
proc print;run;
symbol1 interpol=RL c=black h=1 v=dot;
axis2 order=(8, 13, 18, 23, 28);
axis1 order=(10000,20000,30000,40000,50000,60000); proc gplot data=one;plot y*x / haxis=axis2 vaxis=axis1;run;
proc reg data=one; model y=x; run;
[결과 - 그래프]
위와 같이 그래프가 나왔습니다.
전반적으로 상승직선으로 나타난 것으로 보아
인터넷사용시간(분)이 컴퓨터 소프트웨어 수리 비용(천원)에 영향을 미치는 것으로 보여집니다.
[결과 - 회귀분석]
[분석]
모형의 적합성 판정
Analysis of Variance의 Pr > F(F값에 의한 P-value) < 0.0001 이므로 유의수준 0.05에서 H0을 기각.
회귀선
Analysis of Variance의 R-square = 0.6760 으로 약 68%의 회귀선을 설명.
추정
Parameter Estimates에서
Intercept(B0) = -7993.77722(계수값) / 0.0739(유의확률) 이 유의수준 0.05보다 크기 때문에 기각.
Parameter Esimates에서
x(B1) = 2219.68248(계수값) / 0.0001(유의확률)이 유의수준 0.05보다 작기 때문에 채택.
회귀분석식
Y(수리비용-천원단위)=-7993.72 + 22248 X(인터넷 사용시간-분단위) +
따라서
위와 같은 결과를 나타났기에
‘인터넷 사용시간이 컴퓨터 소프트웨어 수리 비용에 영향을 미칠 것이다.’ 라는
가정은 성립된다는 판단.
proc glm : 일반선형모형에서 통계적 추론을 진행하는 프로시저.
-단순회귀분석
두 변수 사이에 존재하는 함수 관계 찾기.
독립변수가 종속변수에 영향을 미친다.
단순회귀분석으로 설명이 불가능할 때에는 다중회귀분석을 이용한다.
-모형
Yi = 종속 / 반응 / 내생 / 목적
Xi = 독립 / 요인 / 외생 / 입력
-오차항 기본 가정
정규성 :
독립성 :
등분산성 :
-SAS에서 사용하는 방법
[사용 확장자]
Data=one;
input x y @@;
cards;
11 2.5 13 2.7 14.5 2.9 12 2.5 17 4.1 16 4.0 15.5 3.8 14 3.0 13 2.9 18 4.2;
run;
proc print; run;
symbol interpol=RL c=black h=1 v=dot;
axis1 order=(10,13,16,19);
axis2 order=(2,3,4,5);
proc gplot data=one;
plot y*x/haxis=axis1 vaxis=axis2;
run;
proc reg data=one;
model y=x;
run;
<-Data 이름지정
<-x와 y로 변수 지정
<-자료 입력
<-입력한 자료를 출력
<-회귀직선을 interpol로 설정 후검은색, 1의 굵기, 점으로 표현
<-axis1,axis2에 각각 구간 설정
<-그래프 그리기에 one이란 data 소환
<-x와 y에 대한 그래프, haxis(x축)에 axis1 실행, vaxis(y축)에 axis2 실행.
<-회귀 프로시저 사용
<-model에는 종속변수 = 독립변수 형태로 사용
[결과]
위와 같은 결과표를 얻을 수 있습니다.
1. 회귀분석식 : 평균학점 = -0.9445+0.29198*입시성적
2. F값이 77.31이고 P-value값이 0.001 회귀모형의 적합성은
유의확률 Pr > F의 값 0.0001이므로 유의수준 0.05%에서 H0을 기각.
3. 위 과정으로 회귀모형이 적합하다고 판단.
4. R값이 0.902 종속변수에 관현 변동이 약 91%이므로
회귀모형 독립변수에 의해 영향을 받는다고 판단.
5. 추정
Parameter Estimates의 Intercept = B0 = -0.95(계수값)
0.0874(유의확률) 이므로 유의수준 0.05보다 크기 때문에 기각.
Parameter Estimates의 x = B1 = 0.29(계수값)
0.001(유의확률) 이므로 유의수준 0.05보다 작기 때문에 채택.
따라서, B1은 평균학점을 설명해주는 변수로 판단.
2. 과제
단순회귀분석에 사용할 수 있는 자료(40개 이상)를 찾아보기.
자료에 대한 설명과 분석방향 작성.
수업시간에 사용한 SAS처럼 활용해서 월요일(2012년 3월 19일 월요일 오후 5시까지 제출)
-자료설명
요즘은 컴퓨터 없이 살기 힘든 세상입니다. 인터넷 사용이 보급화 됨에 따라 항시 숨어있는 바이러스가 득실득실거리는 인터넷이 소중한 컴퓨터의 소프트웨어를 공격하고 이 누적된 데미지는 컴퓨터 손상에 이르러 그에 따른 수리비용이 발생할 것입니다. 물론 컴퓨터의 소프트웨어 수리에 인터넷의 사용이 얼마나 영향을 미치는지는 알 수 없지만 관계가 있을 것이라는 가정하에 자료를 선정하게 돼었습니다.
-분석방향
독립변수 : 인터넷 사용 시간(분) - 원인이 되는 요소이기 때문에 독립변수로 지정.
종속변수 : 소프트웨어 수리 비용(천원) - 확인하고픈 요소이기 때문에 종속변수로 지정.
-SAS 사용
[사용 확장자]
data one;input x y;cards;9.5 14814 8.4 17502 9.8 14007 11.0 19443 8.3 7573 9.9 14191 8.6 9714 6.4 8076 7.1 5304 8.2 10728 17.4 27243 15.0 25319 15.2 28028 16.4 31793 16.7 39499 15.4 25312 15.0 26222 14.8 26751 13.6 18036
25.6 56305 23.4 10417 24.4 52594 23.3 49512 19.5 32207 21.2 48218 22.8 50453 21.7 47661 19.8 38138 20.8 37045 15.3 29455 16.8 24865 16.7 10445 13.6 38562 25.6 57556 24.1 47661 22.7 38119 19.2 28025 15.7 11046 19.7 22485 22.5 47357 ;run;
proc print;run;
symbol1 interpol=RL c=black h=1 v=dot;
axis2 order=(8, 13, 18, 23, 28);
axis1 order=(10000,20000,30000,40000,50000,60000); proc gplot data=one;plot y*x / haxis=axis2 vaxis=axis1;run;
proc reg data=one; model y=x; run;
[결과 - 그래프]
위와 같이 그래프가 나왔습니다.
전반적으로 상승직선으로 나타난 것으로 보아
인터넷사용시간(분)이 컴퓨터 소프트웨어 수리 비용(천원)에 영향을 미치는 것으로 보여집니다.
[결과 - 회귀분석]
[분석]
모형의 적합성 판정
Analysis of Variance의 Pr > F(F값에 의한 P-value) < 0.0001 이므로 유의수준 0.05에서 H0을 기각.
회귀선
Analysis of Variance의 R-square = 0.6760 으로 약 68%의 회귀선을 설명.
추정
Parameter Estimates에서
Intercept(B0) = -7993.77722(계수값) / 0.0739(유의확률) 이 유의수준 0.05보다 크기 때문에 기각.
Parameter Esimates에서
x(B1) = 2219.68248(계수값) / 0.0001(유의확률)이 유의수준 0.05보다 작기 때문에 채택.
회귀분석식
Y(수리비용-천원단위)=-7993.72 + 22248 X(인터넷 사용시간-분단위) +
따라서
위와 같은 결과를 나타났기에
‘인터넷 사용시간이 컴퓨터 소프트웨어 수리 비용에 영향을 미칠 것이다.’ 라는
가정은 성립된다는 판단.
키워드
추천자료
회귀 분석을 이용한 선형 추정기의 설계
거창군 노인통합복지센터 실습기관분석(사회복지현장실습, 노인복지시설) PPT, 파워포인트
거창군립노인요양병원 실습기관분석(사회복지현장실습, 노인의료복지시설) PPT, 파워포인트
거창시니어클럽 기관분석(실습기관분석, 사회복지현장실습, 노인복지시설) PPT, 파워포인트
경남서부아동보호전문기관 실습기관분석보고서(아동복지, 사회복지현장실습) PPT, 파워포인트
도남사회복지관 실습기관분석(사회복지현장실습) PPT, 파워포인트
위천지역아동센터 실습기관분석보고서(아동복지, 사회복지현장실습) PPT, 파워포인트
지리산실버타운 실습기관분석(평안복지재단, 사회복지현장실습, 노인복지시설) PPT, 파워포인트
창원시성산구노인종합복지관 실습기관분석보고서(사회복지현장실습, 노인종합복지관, 노인복...
거창노인통합복지센터 실습기관분석(사회복지현장실습, 노인복지시설) PPT, 파워포인트
거창시니어클럽 실습기관분석(사회복지현장실습, 노인복지시설) PPT, 파워포인트
방송통신대학교 탐색적 자료분석 - 줄기-잎-그림과 다섯수치요약 특징 & 흡연상태에 따른...
[광주시 사회 복지 분석] 「광주시 광산구 실습지역 분석 보고서」 광주시 광산구 복지 실태,...
성민보육원 실습기관분석보고서(아동복지, 사회복지현장실습) PPT, 파워포인트
소개글