(방송통신대 고급R활용 기말과제물)교재 1장 연습문제 1번(p.34)의 데이터를 이용하여 성별로 용량 혈압 나이의 평균 및 표준편차를 구하시오 외 3문제
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

(방송통신대 고급R활용 기말과제물)교재 1장 연습문제 1번(p.34)의 데이터를 이용하여 성별로 용량 혈압 나이의 평균 및 표준편차를 구하시오 외 3문제에 대한 보고서 자료입니다.

목차

1. 교재 1장 연습문제 1번(p.34)의 데이터를 이용하여
A. 성별로 용량, 혈압, 나이의 평균 및 표준편차를 구하시오. (3점)
B. 성별로 혈압의 상자그림을 그리고 비교하시오. (3점)
C. 성별로 혈압에 차이가 있는지 검정하시오. (3점)
D. 혈압이 130 미만이면 “Low”, 130 이상이면 “High” 값을 가지는 새로운 변수를 만드시오. (3점)

2. 교재 1장 연습문제 2번(p.34)의 데이터를 이용하여 각 분야별 월수입의 평균과 표준편차를 구하시오. (4점)

3. 교재 3장 연습문제 8번(p.120)의 데이터를 이용하여 일원배치 분산분석을 수행하시오. (5점)

4. R에 datarium 패키지에 내장된 depression 데이터셋은 우울증 환자들의 우울점수 자료이다. 변수 t0은 우울증 치료 전에 측정한 우울점수이고, 변수 t2는 우울증 치료 3개월 후에 측정한 우울점수이다.
A. x축을 t0, y축을 t2로 하는 산점도를 그리시오. (3점)
B. t0가 독립변수이고 t2가 결과변수인 선형회귀분석을 수행하여 회귀직선의 절편과 기울기를 구하시오. (3점)
C. 4-A에서 그린 산점도 위에 4-B에서 구한 회귀직선을 그리시오. (3점)

5. 참고문헌

본문내용

다.
D. 혈압이 130 미만이면 “Low”, 130 이상이면 “High” 값을 가지는 새로운 변수를 만드시오. (3점)
> hw.data$BP_LEVEL <- ifelse(hw.data$BP < 130, \"Low\", \"High\")
> hw.data
2. 교재 1장 연습문제 2번(p.34)의 데이터를 이용하여 각 분야별 월수입의 평균과 표준편차를 구하시오. (4점)
> field <- factor(c(1,1,1,2,2,2,2,3,3,3,3)) # 분야
> income <- c(87,90,62,80,70,65,57,100,115,120,102) # 월수입
> fieldIncome <- data.frame(field, income) # 데이터 프레임 생성
> group_by(fieldIncome, field) %>% summarize(mean(income),sd(income))
3. 교재 3장 연습문제 8번(p.120)의 데이터를 이용하여 일원배치 분산분석을 수행하시오. (5점)
> group <- factor(c(rep(1,times=10),rep(2,times=10),rep(3,times=10),rep(4,times=10)))
> score <-
c(11,10,8,11,10,10,11,11,10,9,11,11,9,11,12,13,9,10,11,10,12,14,10,12,10,12,12,12,11,12,11,10,8,11,11,9,10,11,11,10)
> groupScore <- data.frame(group, score) # 데이터 프레임 생성
> ow <- lm(score~group, data=groupScore)
> anova(ow)
factor 함수로 그룹의 범주를 의미하는 범주형 데이터(1,2,3,4)를 요소로 하는 팩터를 만든다. lm함수를 이용하여 일원분산분석을 위한 모형을 구축한 후, anova 함수를 실행한 결과는 아래와 같다.
R의 stats 패키지의 lm과 anova 함수로 그룹별로 데이터의 평균에 차이가 나는지 일원배치 분산분석을 한 결과 아래 그림처럼 분산분석표가 나왔다. 이 표를 통해 그룹별 데이터의 차이를
검정한 결과, 검정통계량 4.3154, 유의확률 0.01066로 유의수준 0.05에서 통계적으로 유의한 차이(∵ p<α)를 보였다. 즉 그룹별로 평균값이 동일하다는 귀무가설은 기각하고, 적어도 하나의 평균은 나머지 그룹과 다르다는 대립가설을 채택한다.
4. R에 datarium 패키지에 내장된 depression 데이터셋은 우울증 환자들의 우울점수 자료이다. 변수 t0은 우울증 치료 전에 측정한 우울점수이고, 변수 t2는 우울증 치료 3개월 후에 측정한 우울점수이다.
A. x축을 t0, y축을 t2로 하는 산점도를 그리시오. (3점)
> install.packages(\"datarium\")
> library(datarium)
> data(depression)
> plot(depression$t0,depression$t2, xlab=\"t0\", ylab=\"t2\", pch=16, col=\"red\")
B. t0가 독립변수이고 t2가 결과변수인 선형회귀분석을 수행하여 회귀직선의 절편과 기울기를 구하시오. (3점)
> lm(depression$t2 ~ depression$t0, data=depression)
위 결과에서 Intercept의 -19.1936은 절편이고, depression$t0의 값 0.6062는 기울기다. 따라서 회귀계수를 통해 추성된 회귀직선의 식은 다음과 같다.
위 회귀모형의 유의성 검정은 다음과 같다.
> anova(lm(t2 ~ t0, data=depression))
위 분산분석표에서 유의확률은 0.01196으로 유의수준 0.05보다 작으므로 회귀모형은 통계적으로 유의하다고 판단한다.
C. 4-A에서 그린 산점도 위에 4-B에서 구한 회귀직선을 그리시오. (3점)
> plot(depression$t0,depression$t2, xlab=\"t0\", ylab=\"t2\", pch=16, col=\"red\")
> abline(lm(t2 ~ t0, data=depression),col=\"blue\")
abline 함수를 이용해 산점도 위에 회귀직선을 추가하면 다음과 같은 그래프를 얻는다.
5. 참고문헌
심송용, 이윤동, 이은경, 김성수(2015), 고급 R 활용, 출판문화원.
유성모(2016), 논문작성을 위한 R 통계분석 쉽게 배우기, 황소걸음아카데미.
이윤환(2016), (제대로 알고 쓰는)R 통계분석, 한빛아카데미.
  • 가격7,000
  • 페이지수9페이지
  • 등록일2021.11.05
  • 저작시기2021.11
  • 파일형식한글(hwp)
  • 자료번호#1158151
본 자료는 최근 2주간 다운받은 회원이 없습니다.
다운로드 장바구니