목차
1. 만 7세 남자 아동의 평균 몸무게를 추정하기 위하여 만 7세 남자 아동 100명을 모집하여 몸무게를 측정하고 평균을 계산하였다. 다음의 개념이 각각 모집단, 표본, 모수, 통계량 중 무엇에 해당하는지 쓰시오.
(1) 모집된 만 7세 남자 아동 100명 (2점)
(2) 모집된 100명의 평균 몸무게 (2점)
2. 교재와 강의에서 사용한 췌장암 환자 데이터(biostat_ex_data.csv)를 이용하여 다음의 질문에 답하시오.
(1) 바이오통계학 깃허브 웹페이지 https://github.com/biostat81/biostatistics 에서 데이터 파일(biostat_ex_data.csv)을 다운로드 받고 R에 데이터를 읽어들이고 저장하시오. (힌트: 교재 9쪽 프로그램 1-3에서 1행을 본인의 컴퓨터 환경에 맞게 수정하고 실행하여 작업 디렉터리를 설정한 후, 2, 3행을 실행한다.) 교재를 참고하여 범주형 변수를 factor 형태로 저장하시오. (힌트: dplyr 패키지를 설치한 후, 교재 11쪽 프로그램 1-4를 실행한다.) 수축기 혈압(SBP)의 분포를 나타내는 히스토그램을 그리시오. R 명령문과 히스토그램을 제출하시오. (4점)
① R로 데이터 읽고 저장하기 ② factor 형태로 저장 ③ 히스토그램 그리기
(2) 이 데이터에 포함된 췌장암 환자 156명 전체의 수축기 혈압의 중앙값을 구하시오. R 명령문을 같이 제출하시오. (4점)
(3) 이 데이터에 포함된 156명이 대표하는 모집단의 평균 수축기 혈압에 대한 95% 신뢰구간을 구하시오. R 명령문과 출력결과를 같이 제출하시오. (4점)
3. 2번 문항에서 저장한 췌장암 환자 데이터를 이용하여, 그 데이터가 대표하는 흡연자 모집단의 평균 수축기 혈압과 비흡연자 모집단의 평균 수축기 혈압을 비교하는 가설검정을 수행하기 위해 아래의 질문에 답하시오.
(1) 귀무가설은 무엇인가? (3점)
(2) 대립가설은 무엇인가? (단, 어느 쪽이 더 크다고 방향을 정해놓지 않고, 두 그룹의 평균 수축기 혈압이 같은지 다른지 알아보는 양측 검정을 할 것.) (3점)
(3) R을 이용하여 이표본 이분산 t-검정을 수행하시오. R 명령문과 출력결과를 제출하시오. (4점)
(4) (3)에서 수행한 가설검정 결과를 해석하시오. (4점)
4. 참고문헌
(1) 모집된 만 7세 남자 아동 100명 (2점)
(2) 모집된 100명의 평균 몸무게 (2점)
2. 교재와 강의에서 사용한 췌장암 환자 데이터(biostat_ex_data.csv)를 이용하여 다음의 질문에 답하시오.
(1) 바이오통계학 깃허브 웹페이지 https://github.com/biostat81/biostatistics 에서 데이터 파일(biostat_ex_data.csv)을 다운로드 받고 R에 데이터를 읽어들이고 저장하시오. (힌트: 교재 9쪽 프로그램 1-3에서 1행을 본인의 컴퓨터 환경에 맞게 수정하고 실행하여 작업 디렉터리를 설정한 후, 2, 3행을 실행한다.) 교재를 참고하여 범주형 변수를 factor 형태로 저장하시오. (힌트: dplyr 패키지를 설치한 후, 교재 11쪽 프로그램 1-4를 실행한다.) 수축기 혈압(SBP)의 분포를 나타내는 히스토그램을 그리시오. R 명령문과 히스토그램을 제출하시오. (4점)
① R로 데이터 읽고 저장하기 ② factor 형태로 저장 ③ 히스토그램 그리기
(2) 이 데이터에 포함된 췌장암 환자 156명 전체의 수축기 혈압의 중앙값을 구하시오. R 명령문을 같이 제출하시오. (4점)
(3) 이 데이터에 포함된 156명이 대표하는 모집단의 평균 수축기 혈압에 대한 95% 신뢰구간을 구하시오. R 명령문과 출력결과를 같이 제출하시오. (4점)
3. 2번 문항에서 저장한 췌장암 환자 데이터를 이용하여, 그 데이터가 대표하는 흡연자 모집단의 평균 수축기 혈압과 비흡연자 모집단의 평균 수축기 혈압을 비교하는 가설검정을 수행하기 위해 아래의 질문에 답하시오.
(1) 귀무가설은 무엇인가? (3점)
(2) 대립가설은 무엇인가? (단, 어느 쪽이 더 크다고 방향을 정해놓지 않고, 두 그룹의 평균 수축기 혈압이 같은지 다른지 알아보는 양측 검정을 할 것.) (3점)
(3) R을 이용하여 이표본 이분산 t-검정을 수행하시오. R 명령문과 출력결과를 제출하시오. (4점)
(4) (3)에서 수행한 가설검정 결과를 해석하시오. (4점)
4. 참고문헌
본문내용
명령문으로 95% 신뢰구간은 t.test함수로 구한다.
conf.level의 디폴값은 0.95이므로 설정하지 않아도 된다.
t.test(dat1$SBP, conf.level = 0.95)
위 결과에 따라 모집단의 평균 수축기 혈압에 대한 95% 신뢰구간은 다음과 같다.
[190.9361, 121.8617]
단, 95% 신뢰구간의 데이터만 필요하므로 다음과 같이 구할 수도 있다.
t.test(dat1$SBP)$conf.int
109.93608089131 · 121.861660782946
3. 2번 문항에서 저장한 췌장암 환자 데이터를 이용하여, 그 데이터가 대표하는 흡연자 모집단의 평균 수축기 혈압과 비흡연자 모집단의 평균 수축기 혈압을 비교하는 가설검정을 수행하기 위해 아래의 질문에 답하시오.
(1) 귀무가설은 무엇인가? (3점)
통계적 가설검정에서는 귀무가설(null hypothesis)과 대립가설(alternative hypothesis)을 설정하고 데이터를 이용하여 결론을 내린다. 일반적으로 귀무가설은 로 대립가설은 으로 표현한다. 귀무가설은 이미 받아들이고 있는 기존 통념으로 주로 ‘어떤 모수가 어떤 특정값과 같다’, ‘어떤 두 모수의 값이 서로 같다’는 것으로 설정된다. 대립가설은 귀무가설과 반대로 기존의 통념과 다른 새로운 추정으로서 보통 ‘어떤 모수가 어떤 특정값과 다르다’, ‘어떤 모수가 어떤 특정 값보다 크다(또는 작다)’, ‘어떤 두 모수의 값이 서로 다르다’ 등의 내용으로 정해진다. 가설검정은 기존의 통념인 귀무가설을 기각할 만큼 강력한 데이터가 있는지 없는지 판단하는 과정이다. 따라서 이상의 내용을 바탕으로 문제의 귀무가설과 대립가설을 다음과 같이 설정된다.
: [흡연자 모집단의 SBP 평균과()과 비흡연자 모집단의 SBP 평균()은 같다.]
(2) 대립가설은 무엇인가? (단, 어느 쪽이 더 크다고 방향을 정해놓지 않고, 두 그룹의 평균 수축기 혈압이 같은지 다른지 알아보는 양측 검정을 할 것.) (3점)
: [흡연자 모집단의 SBP 평균과()과 비흡연자 모집단의 SBP 평균()은 같지 않다.]
(3) R을 이용하여 이표본 이분산 t-검정을 수행하시오. R 명령문과 출력결과를 제출하시오. (4점)
양측검정이므로 alternative=\"two.sided\"이지만, 이는 디폴트 값이므로 별도로 설정하지 않는다. 단측검정이면 alternative는 ‘greater\' 또는 \'less\'로 설정해주면 된다.
t.test(SBP ~ smoking, data=dat1)
(4) (3)에서 수행한 가설검정 결과를 해석하시오. (4점)
검정결과에서 p값 0.1646은 유의수준 =0.05보다 크므로 귀무가설을 기각하지 못한다. 이는 두 그룹 간 평균 차이가 통계적으로 유의미하지 않다는 것을 의미한다. 즉, 흡연자와 비흡연자 간의 SBP는 다르지 않다는 결론을 얻는다.
4. 참고문헌
바이오통계학(2023) 박서영·김화정, 한국방송통신대학교출판문화원.
통계학개론(2022), 박서영·이기재·이긍희·장영재, 한국방송통신대학교출판문화원.
conf.level의 디폴값은 0.95이므로 설정하지 않아도 된다.
t.test(dat1$SBP, conf.level = 0.95)
위 결과에 따라 모집단의 평균 수축기 혈압에 대한 95% 신뢰구간은 다음과 같다.
[190.9361, 121.8617]
단, 95% 신뢰구간의 데이터만 필요하므로 다음과 같이 구할 수도 있다.
t.test(dat1$SBP)$conf.int
109.93608089131 · 121.861660782946
3. 2번 문항에서 저장한 췌장암 환자 데이터를 이용하여, 그 데이터가 대표하는 흡연자 모집단의 평균 수축기 혈압과 비흡연자 모집단의 평균 수축기 혈압을 비교하는 가설검정을 수행하기 위해 아래의 질문에 답하시오.
(1) 귀무가설은 무엇인가? (3점)
통계적 가설검정에서는 귀무가설(null hypothesis)과 대립가설(alternative hypothesis)을 설정하고 데이터를 이용하여 결론을 내린다. 일반적으로 귀무가설은 로 대립가설은 으로 표현한다. 귀무가설은 이미 받아들이고 있는 기존 통념으로 주로 ‘어떤 모수가 어떤 특정값과 같다’, ‘어떤 두 모수의 값이 서로 같다’는 것으로 설정된다. 대립가설은 귀무가설과 반대로 기존의 통념과 다른 새로운 추정으로서 보통 ‘어떤 모수가 어떤 특정값과 다르다’, ‘어떤 모수가 어떤 특정 값보다 크다(또는 작다)’, ‘어떤 두 모수의 값이 서로 다르다’ 등의 내용으로 정해진다. 가설검정은 기존의 통념인 귀무가설을 기각할 만큼 강력한 데이터가 있는지 없는지 판단하는 과정이다. 따라서 이상의 내용을 바탕으로 문제의 귀무가설과 대립가설을 다음과 같이 설정된다.
: [흡연자 모집단의 SBP 평균과()과 비흡연자 모집단의 SBP 평균()은 같다.]
(2) 대립가설은 무엇인가? (단, 어느 쪽이 더 크다고 방향을 정해놓지 않고, 두 그룹의 평균 수축기 혈압이 같은지 다른지 알아보는 양측 검정을 할 것.) (3점)
: [흡연자 모집단의 SBP 평균과()과 비흡연자 모집단의 SBP 평균()은 같지 않다.]
(3) R을 이용하여 이표본 이분산 t-검정을 수행하시오. R 명령문과 출력결과를 제출하시오. (4점)
양측검정이므로 alternative=\"two.sided\"이지만, 이는 디폴트 값이므로 별도로 설정하지 않는다. 단측검정이면 alternative는 ‘greater\' 또는 \'less\'로 설정해주면 된다.
t.test(SBP ~ smoking, data=dat1)
(4) (3)에서 수행한 가설검정 결과를 해석하시오. (4점)
검정결과에서 p값 0.1646은 유의수준 =0.05보다 크므로 귀무가설을 기각하지 못한다. 이는 두 그룹 간 평균 차이가 통계적으로 유의미하지 않다는 것을 의미한다. 즉, 흡연자와 비흡연자 간의 SBP는 다르지 않다는 결론을 얻는다.
4. 참고문헌
바이오통계학(2023) 박서영·김화정, 한국방송통신대학교출판문화원.
통계학개론(2022), 박서영·이기재·이긍희·장영재, 한국방송통신대학교출판문화원.
소개글