목차
(1) (10점) 어떤 대학에서 학생의 40%는 통계학 전공이고, 나머지 60%는 경제학 전공이다.
통계학 전공 학생 중 70%는 수학 동아리에 가입해 있고,
경제학 전공 학생 중 20%가 수학 동아리에 가입해 있다.
한 학생을 무작위로 선택했더니, 그 학생이 수학 동아리 회원이었다.
이 학생이 통계학 전공일 확률은 얼마인가?
(2) (10점) A회사와 B회사의 제품 불량률을 각각 , 라고 하자.
A회사에서 무작위로 50개의 제품을 뽑아 검사했더니, 그 중 8개가 불량품이었다.
B회사에서 무작위로 40개의 제품을 뽑아 검사했더니, 그 중 3개가 불량품이었다.
불량률 와 의 사전분포는 서로 독립이며, 각각 균등분포 라고 가정한다.
(3) (10점) 한 백신이 특정 질병을 예방하는 효과가 있는지를 알아보기 위해 두 집단에서 임상시험을 실시하였다.
? 백신 접종 그룹(A): 200명 중 12명이 질병에 걸림
? 비접종 그룹(B): 180명 중 18명이 질병에 걸림
각 집단의 발병 확률을 각각 와 라 하자.
우리는 다음 두 가설을 비교하고자 한다.
(3) 참고문헌
통계학 전공 학생 중 70%는 수학 동아리에 가입해 있고,
경제학 전공 학생 중 20%가 수학 동아리에 가입해 있다.
한 학생을 무작위로 선택했더니, 그 학생이 수학 동아리 회원이었다.
이 학생이 통계학 전공일 확률은 얼마인가?
(2) (10점) A회사와 B회사의 제품 불량률을 각각 , 라고 하자.
A회사에서 무작위로 50개의 제품을 뽑아 검사했더니, 그 중 8개가 불량품이었다.
B회사에서 무작위로 40개의 제품을 뽑아 검사했더니, 그 중 3개가 불량품이었다.
불량률 와 의 사전분포는 서로 독립이며, 각각 균등분포 라고 가정한다.
(3) (10점) 한 백신이 특정 질병을 예방하는 효과가 있는지를 알아보기 위해 두 집단에서 임상시험을 실시하였다.
? 백신 접종 그룹(A): 200명 중 12명이 질병에 걸림
? 비접종 그룹(B): 180명 중 18명이 질병에 걸림
각 집단의 발병 확률을 각각 와 라 하자.
우리는 다음 두 가설을 비교하고자 한다.
(3) 참고문헌
본문내용
생이 경제학 전공일 사건
- M: 학생이 수학 동아리 회원일 사건
문제에서 주어진 조건은 다음과 같다.
P(S) = 0.4P(E) = 0.6P(M | S) = 0.7P(M | E) = 0.2
주어진 문제는 학생이 수학 동아리 회원이라는 사실이 주어졌을 때, 통계학 전공일 확률 P(S|M)을 구하는 것이다.
베이즈 정리에 따르면 다음과 같이 계산할 수 있다.P(S | M) = [P(M | S) * P(S)] / P(M)여기서 분모 P(M)은 전체 확률 공식으로 구한다.P(M) = P(M | S) * P(S) + P(M | E) * P(E)
전체 확률 공식은 사건 A의 확률을 구히기 위해 표본공간을 분할하는 사건들을 통해 계산하는 방법이다.
사건 {B1, B2, ..., Bn}이 표본공간을 분할한다면,
P(S | M) = (0.7 * 0.4) / [(0.7 * 0.4) + (0.2 * 0.6)]= 0.28 / 0.40= 0.7
즉, 확률은 0.7 (70%)이다
(2) (10점) A회사와 B회사의 제품 불량률을 각각 , 라고 하자.
A회사에서 무작위로 50개의 제품을 뽑아 검사했더니, 그 중 8개가 불량품이었다.
B회사에서 무작위로 40개의 제품을 뽑아 검사했더니, 그 중 3개가 불량품이었다.
불량률 와 의 사전분포는 서로 독립이며, 각각 균등분포 라고 가정한다.
(a) 와 의 사후분포를 각각 구하시오.
베이즈규칙에 따라 사후분포는 사전분포와 가능도의 곱에 비례한다.
불량률 와 의 사전분포는 각각 균등분포 이다.
확률밀도함수의 적분은 1이므로 와 의 사전분포는 다음과 같이 계산된다.
주어진 문제에서 x는 불량여부의 두 가지 결과를 가질 수 있는 실험을 n번 독립시행하여 이 중 한 가지 결과가 나온 횟수이므로 x는 다음과 같은 이항분포를 따른다.
따라서 사후분포는 다음과 같이 계산된다.
위 식에서 지시함수 I는 상수이므로(여기서는 1) 사후분포는 에 비례한다. 또한 는 아래의 베타분포의 밀도함수와 동일한 형식이다.
따라서 의 사후분포는 이다.
즉, 사전분포가 균등분포일 때 가능도가 이항분포이면 그 사후분포는 베타분포가 된다.
따라서 의 사후분포는 문제에서 주어진 값 n = 50, x= 8를 대입하면
이고,
의 사후분포는 문제에서 주어진 값 n = 40, x= 3를 대입하면
이다.
(b) 의 사후분포를 추정하기 위해, R을 사용하여 와 의 사후분포에서 각각 2000개의 난수를 추출하시오.
# 사후분포에서 난수 생성
set.seed(123) # 결과가 재현되도록 시드 설정
# A회사: Beta(9, 43) 분포에서 2000개 샘플
thetaA <- rbeta(2000, shape1 = 9, shape2 = 43)
# B회사: Beta(4, 38) 분포에서 2000개 샘플
thetaB <- rbeta(2000, shape1 = 4, shape2 = 38)
(c) (b)에서 구한 난수들을 사용하여 의 사후평균, 사후표준편차, 95% 신용구간(credible interval)을 구하시오.
delta <- thetaA - thetaB
cat(\"사후평균:\", mean(delta), \"\\n\")
cat(\"사후표준편차:\", sd(delta), \"\\n\")
ci <- quantile(delta, c(0.025, 0.975))
cat(\"95% 신용구간 :\", \"[\", ci[1], \",\", ci[2], \"]\\n\")
(d) 일 확률을 추정하시오.
cat(\"thetaA > thetaB일 확률: \", mean(delta > 0))
(3) (10점) 한 백신이 특정 질병을 예방하는 효과가 있는지를 알아보기 위해 두 집단에서 임상시험을 실시하였다.
백신 접종 그룹(A): 200명 중 12명이 질병에 걸림
비접종 그룹(B): 180명 중 18명이 질병에 걸림
각 집단의 발병 확률을 각각 와 라 하자.
우리는 다음 두 가설을 비교하고자 한다.
(a) 백신 접종 그룹과 비접종그룹 전체의 데이터를 라 할 때, 하에서 데이터의 주변분포 를 구하시오. 의 사전분포가 라고 가정한다.
먼저 그룹A와 그룹B의 가능도 함수의 경우, 발병 여부라는 두 경우 중 하나의 결과만 발생하므로 이항분포에 해당한다.
그룹A :
그룹B:
그리고 두 그룹은 독립적이므로 전체 데이터 x에 대한 가능도 함수는 각각의 가능도 함수의 곱으로 계산된다.
귀무가설 를 전제로 라고 가정할 수 있다. 이 가설 하에서 가능도 함수는 다음과 같이 단일 모수 에 대한 함수로 표현된다.
주변분포는 가능도 함수를 모수 의 사전분포에 대해 적분하여 계산한다.
위 적분은 베타함수의 정의와 일치한다.
즉,
따라서 최종적으로 주변분포는 다음과 같이 계산된다.
(b) 하에서 데이터의 주변분포 를 구하시오. 와 의 사전분포는 서로 독립이며, 각각 균등분포 라고 가정한다.
하에서 와 는 서로 독립이고 균등분포 을 따른다.
또한 두 그룹의 데이터는 모두 이항분포를 따르므로, 두 그룹의 가능도 함수는 다음과 같다.
그룹 A: 200명 중 12명 발병 ->
그룹 B: 180명 중 18명 발병 ->
와 가 독립이므로,
따라서
(c) (a)에서 구한 주변분포들을 이용하여 베이즈인자 를 구하시오.
(d) 와 의 사전확률이 각각 1/2일 때 와 의 사후확률을 구하시오.
베이즈인자와 사전확률들 알면 사후확률은 다음과 같이 계산한다.
따라서 사후확률은 다음과 같다.
(e) 위 확률을 이용하여 와 중 어느 쪽이 더 데이터에 의해 지지되는지 논하시오.
의 사후확률이 0.838로 사후확률 0.162보다 크므로 가 데이터에 의해 더 지지받는다. 문제 (d)에서 사전확률이 1/2로 동일하다고 가정했다. 베이즈인자는 사전오즈가 1일 때 사후오즈가 되므로, 사후오즈는 5.169가 된다. 이는 가 보다 약 5배 강하게 지지된다는 의미다. 따라서 “두 그룹의 발병확률이 같다”는 귀무가설이 “두 그룹의 발병확률이 다르다”는 대립가설보다 더 설득력 있는 가설이라고 할 것이다.
(3) 참고문헌
이재용·이기재(2022), 베이즈 데이터 분석, 한국방송통신대학교출판문화원.
과제 스트레스 싹~ 학점 쑥!
https://www.happycampus.com/store/zzzyzyztusz/
- M: 학생이 수학 동아리 회원일 사건
문제에서 주어진 조건은 다음과 같다.
P(S) = 0.4P(E) = 0.6P(M | S) = 0.7P(M | E) = 0.2
주어진 문제는 학생이 수학 동아리 회원이라는 사실이 주어졌을 때, 통계학 전공일 확률 P(S|M)을 구하는 것이다.
베이즈 정리에 따르면 다음과 같이 계산할 수 있다.P(S | M) = [P(M | S) * P(S)] / P(M)여기서 분모 P(M)은 전체 확률 공식으로 구한다.P(M) = P(M | S) * P(S) + P(M | E) * P(E)
전체 확률 공식은 사건 A의 확률을 구히기 위해 표본공간을 분할하는 사건들을 통해 계산하는 방법이다.
사건 {B1, B2, ..., Bn}이 표본공간을 분할한다면,
P(S | M) = (0.7 * 0.4) / [(0.7 * 0.4) + (0.2 * 0.6)]= 0.28 / 0.40= 0.7
즉, 확률은 0.7 (70%)이다
(2) (10점) A회사와 B회사의 제품 불량률을 각각 , 라고 하자.
A회사에서 무작위로 50개의 제품을 뽑아 검사했더니, 그 중 8개가 불량품이었다.
B회사에서 무작위로 40개의 제품을 뽑아 검사했더니, 그 중 3개가 불량품이었다.
불량률 와 의 사전분포는 서로 독립이며, 각각 균등분포 라고 가정한다.
(a) 와 의 사후분포를 각각 구하시오.
베이즈규칙에 따라 사후분포는 사전분포와 가능도의 곱에 비례한다.
불량률 와 의 사전분포는 각각 균등분포 이다.
확률밀도함수의 적분은 1이므로 와 의 사전분포는 다음과 같이 계산된다.
주어진 문제에서 x는 불량여부의 두 가지 결과를 가질 수 있는 실험을 n번 독립시행하여 이 중 한 가지 결과가 나온 횟수이므로 x는 다음과 같은 이항분포를 따른다.
따라서 사후분포는 다음과 같이 계산된다.
위 식에서 지시함수 I는 상수이므로(여기서는 1) 사후분포는 에 비례한다. 또한 는 아래의 베타분포의 밀도함수와 동일한 형식이다.
따라서 의 사후분포는 이다.
즉, 사전분포가 균등분포일 때 가능도가 이항분포이면 그 사후분포는 베타분포가 된다.
따라서 의 사후분포는 문제에서 주어진 값 n = 50, x= 8를 대입하면
이고,
의 사후분포는 문제에서 주어진 값 n = 40, x= 3를 대입하면
이다.
(b) 의 사후분포를 추정하기 위해, R을 사용하여 와 의 사후분포에서 각각 2000개의 난수를 추출하시오.
# 사후분포에서 난수 생성
set.seed(123) # 결과가 재현되도록 시드 설정
# A회사: Beta(9, 43) 분포에서 2000개 샘플
thetaA <- rbeta(2000, shape1 = 9, shape2 = 43)
# B회사: Beta(4, 38) 분포에서 2000개 샘플
thetaB <- rbeta(2000, shape1 = 4, shape2 = 38)
(c) (b)에서 구한 난수들을 사용하여 의 사후평균, 사후표준편차, 95% 신용구간(credible interval)을 구하시오.
delta <- thetaA - thetaB
cat(\"사후평균:\", mean(delta), \"\\n\")
cat(\"사후표준편차:\", sd(delta), \"\\n\")
ci <- quantile(delta, c(0.025, 0.975))
cat(\"95% 신용구간 :\", \"[\", ci[1], \",\", ci[2], \"]\\n\")
(d) 일 확률을 추정하시오.
cat(\"thetaA > thetaB일 확률: \", mean(delta > 0))
(3) (10점) 한 백신이 특정 질병을 예방하는 효과가 있는지를 알아보기 위해 두 집단에서 임상시험을 실시하였다.
백신 접종 그룹(A): 200명 중 12명이 질병에 걸림
비접종 그룹(B): 180명 중 18명이 질병에 걸림
각 집단의 발병 확률을 각각 와 라 하자.
우리는 다음 두 가설을 비교하고자 한다.
(a) 백신 접종 그룹과 비접종그룹 전체의 데이터를 라 할 때, 하에서 데이터의 주변분포 를 구하시오. 의 사전분포가 라고 가정한다.
먼저 그룹A와 그룹B의 가능도 함수의 경우, 발병 여부라는 두 경우 중 하나의 결과만 발생하므로 이항분포에 해당한다.
그룹A :
그룹B:
그리고 두 그룹은 독립적이므로 전체 데이터 x에 대한 가능도 함수는 각각의 가능도 함수의 곱으로 계산된다.
귀무가설 를 전제로 라고 가정할 수 있다. 이 가설 하에서 가능도 함수는 다음과 같이 단일 모수 에 대한 함수로 표현된다.
주변분포는 가능도 함수를 모수 의 사전분포에 대해 적분하여 계산한다.
위 적분은 베타함수의 정의와 일치한다.
즉,
따라서 최종적으로 주변분포는 다음과 같이 계산된다.
(b) 하에서 데이터의 주변분포 를 구하시오. 와 의 사전분포는 서로 독립이며, 각각 균등분포 라고 가정한다.
하에서 와 는 서로 독립이고 균등분포 을 따른다.
또한 두 그룹의 데이터는 모두 이항분포를 따르므로, 두 그룹의 가능도 함수는 다음과 같다.
그룹 A: 200명 중 12명 발병 ->
그룹 B: 180명 중 18명 발병 ->
와 가 독립이므로,
따라서
(c) (a)에서 구한 주변분포들을 이용하여 베이즈인자 를 구하시오.
(d) 와 의 사전확률이 각각 1/2일 때 와 의 사후확률을 구하시오.
베이즈인자와 사전확률들 알면 사후확률은 다음과 같이 계산한다.
따라서 사후확률은 다음과 같다.
(e) 위 확률을 이용하여 와 중 어느 쪽이 더 데이터에 의해 지지되는지 논하시오.
의 사후확률이 0.838로 사후확률 0.162보다 크므로 가 데이터에 의해 더 지지받는다. 문제 (d)에서 사전확률이 1/2로 동일하다고 가정했다. 베이즈인자는 사전오즈가 1일 때 사후오즈가 되므로, 사후오즈는 5.169가 된다. 이는 가 보다 약 5배 강하게 지지된다는 의미다. 따라서 “두 그룹의 발병확률이 같다”는 귀무가설이 “두 그룹의 발병확률이 다르다”는 대립가설보다 더 설득력 있는 가설이라고 할 것이다.
(3) 참고문헌
이재용·이기재(2022), 베이즈 데이터 분석, 한국방송통신대학교출판문화원.
과제 스트레스 싹~ 학점 쑥!
https://www.happycampus.com/store/zzzyzyztusz/
키워드
추천자료
백신프로그램(컴퓨터백신)의 정의, 백신프로그램(컴퓨터백신)의 종류, 백신프로그램(컴퓨터백...
백신종류와 특징 [RNA백신,DNA백신,사백신,생백신,바이러스벡트,단백질]
백신플랫폼 특징 [RNA백신,DNA백신,사백신,생백신,바이러스벡트,단백질]
경영통계학 ) 확률의 개념을 사례를 들어 설명하고(서론), 제시한 문제를 풀이과정을 포함하...
2022년 2학기 방송통신대 베이즈데이터분석 기말과제물)밀도함수를 따르는 랜덤 숫자를 합격-...
경영통계학(확률이론에 대하여 요약하여 정리하시오
2023년 2학기 방송통신대 베이즈데이터분석 중간과제물)다음은 2014년 군에 입대하는 10명의 ...
[금융제도의이해] 핀테크의 의미를 설명하고, 핀테크가 적용되는 주요 금융사업분야의 최신 ...
사회복지조사론 2025년 2학기 방송통신대 중간과제물- 사회복지조사론 1강 강의내용을 바탕으...
유아교육기관운영관리 2025년 2학기 방송통신대 중간과제물] 유치원과 어린이집의 학급(반) ...
소개글