2023년 2학기 방송통신대 베이즈데이터분석 중간과제물)다음은 2014년 군에 입대하는 10명의 병사들의 몸무게를 잰 결과이다 사후분포를 수식으로 유도하라 등
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

2023년 2학기 방송통신대 베이즈데이터분석 중간과제물)다음은 2014년 군에 입대하는 10명의 병사들의 몸무게를 잰 결과이다 사후분포를 수식으로 유도하라 등에 대한 보고서 자료입니다.

목차

1. (10점) 다음은 2014년 군에 입대하는 10명의 병사들의 몸무게를 잰 결과이다.
68.3, 85.7, 73.8, 83.2, 58.9, 72.7, 70.5, 58.7, 74.1
군에 입대하는 병사들의 몸무게의 평균을 라 하고, 관측된 몸무게들을 라 할 때 다음의 모형을 상정하자.
(a) 의 사후분포를 수식으로 유도하라.
(b) 의 사후평균과 사후표준편차, 95% 신용구간을 구하라.

2. (10점) 한 커피전문점에서 20명의 아메리카노 커피를 주문하는 손님들의 주문을 조사했더니 이 중 12명이 아이스 아메리카노를 주문하고 8명은 따뜻한 아메리카노를 주문했다. 를 아메리카노를 주문하는 손님 중 아이스 아메리카노를 주문하는 손님들의 비율이라 하자. 의 사전분포가

라 하자.

(a) 의 사후분포를 구하라.
(b) 의 사후평균과 사후표준편차, 95% 신용구간을 구하라.

3. (10점) 2번의 커피전문점에서 15명의 라테를 주문하는 손님을 조사했더니 이 중 4명이 아이스 라테를 주문하고 11명이 따뜻한 라테를 주문하였다. 를 라테를 주문하는 손님 중 아이스 라테를 주문하는 손님들의 비율이라고 하자. 의 사전분포가

라 하자.

(a) 의 사후분포를 구하라.
(b) 몬테 카를로 방법을 이용해서 의 사후표본을 R을 이용하여 1000개를 추출하라.
(c) (b)에서 구한 사후표본으로 의 사후평균, 사후표준편차, 95% 신용집합을 구하라.

4. 참고문헌

본문내용

측 이후에 신념이 어떻게 변화하는지 분석할 수 있다. 원래의 확률을 원인으로 생각할 수도 있다. 이때 베이즈 이론은 데이터로부터 원인을 찾는 이론으로 이용할 수도 있다. 즉, 모집단의 모수를 원인으로 받아들일 수 있는 것이다. 이런 의미에서 베이즈 정리의 좌변은 원인의 확률이라고도 한다. 참고로 사전확률(또는 사전분포)에서 사전(事前)은 자료가 얻어지기 전의 확률 또는 분포를 의미한다.
베이즈 통계학에서는 모집단의 모수를 확률변수로 취급한다. 베이즈 통계학에서는 확률분포가 핵심이다. 베이즈 통계학에서 모수는 불확실성을 가지므로 불확실성의 정도를 확률모형으로 표현한다. 데이터는 우도함수를 통해서만 추정에 영향을 준다. 베이즈 추론은 우도함수로 사전분포를 갱신함으로써 사후분포를 계산한다. 베이즈 통계는 데이터가 적어도 추측할 수 있으며, 데이터가 많을수록 정확해진다. 또한 확보한 데이터에 실시간으로 반응하여 추측을 업데이트함으로써 학습 기능도 가지고 있다.
(a) 의 사후분포를 수식으로 유도하라.
사후분포는 사전분포와 가능도의 곱에 비례하므로 다음처럼 계산할 수 있다.
n = 10
= (68.3+85.7+73.8+83.2+58.9+72.7+70.5+58.7+74.1)/10 = 64.6
따라서 사후분포는 이다.
그런데 문제에 주어진 관측값의 개수는 9개이다. 아마도 관측값을 하나 누락하여 문제를 제시한 것으로 보인다. 따라서 추후 과제물 변경 공고에서 나머지 관측값도 추가하여 공지할 것으로 판단된다. 추후 관측값이 하나 더 주어지면 위 풀이과정에서 다른 부분은 수정할 필요없고, 의 값 64.6만 다시 계산해서 수정해주면 된다. 물론 (b)항 문제도 와 관련되므로 사후평균, 사후표준편차, 95% 신용구간을 다시 계산해줘야 한다.
(b) 의 사후평균과 사후표준편차, 95% 신용 구간을 구하라.
의 사후평균은 이므로 64.6이다.
사후표준편차는
100(1-α)%, α∈(0,1) 신용구간은
2. (10점) 한 커피전문점에서 20명의 아메리카노 커피를 주문하는 손님들의 주문을 조사했더니 이 중 12명이 아이스 아메리카노를 주문하고 8명은 따뜻한 아메리카노를 주문했다. 를 아메리카노를 주문하는 손님 중 아이스 아메리카노를 주문하는 손님들의 비율이라 하자. 의 사전분포가
라 하자.
(a) 의 사후분포를 구하라.
베이즈 정리에 따라 사후분포는 사전분포와 가능도의 곱이다. 사전분포는 이미 주어졌으므로 가능도만 구하면 된다. 관찰값은 아이스 아메리카노를 주문하거나 하지 않거나(따뜻한 아메리카노 주문) 둘 중의 하나이므로 이항분포로 생각할 수 있다. 이항분포의 확률질량함수는 다음과 같다.
단, n은 시행횟수, k는 성공(아이스 아메리카노 주문) 횟수
는 성공 확률(아이스 아메리카노 주문할 확률)
따라서 가능도는 다음과 같다.
상수 는 가능도의 형태에 영향을 주지 않아 무시할 수 있으므로, 가능도는 다음과 같이 표현할 수 있다.
따라서 사후분포는 다음과 같다.
즉,
(b) 의 사후평균과 사후표준편차, 95% 신용구간을 구하라.
사후분포는 다음과 같은 베타분포로 볼 수 있다.
베타분포에서 기댓값(평균)과 분산은 각각, 이다.
이므로 위식에 대입하면,
의 사후평균 0.5952,
의 사후표준편차 0.1046 이다.
R 코드를 이용하여 신용구간을 구하면 다음과 같다.
따라서 θ의 95% 신용구간 [0.3839, 0.7894] 이다.
3. (10점) 2번의 커피전문점에서 15명의 라테를 주문하는 손님을 조사했더니 이 중 4명이 아이스 라테를 주문하고 11명이 따뜻한 라테를 주문하였다. 를 라테를 주문하는 손님 중 아이스 라테를 주문하는 손님들의 비율이라고 하자. 의 사전분포가
라 하자.
(a) 의 사후분포를 구하라.
문제2의 (a)와 동일한 유형의 문제이다. 따라서 가능도는 다음과 같다.
사후분포는 사전분포와 가능도의 곱에 비례하므로 사후분포는 다음과 같다.
이를 정리하면 사후분포는 이다.
(b) 몬테 카를로 방법을 이용해서 의 사후표본을 R을 이용하여 1000개를 추출하라.
몬테 카를로 방법은 강대수의 법칙에 따라 확률변수를 생성하여 표본평균을 모집단의 평균으로 근사하는 방법이다. 몬테카를로 방법으로 사후표본 추출한 R코드는 다음과 같다. 베타분포에서 난수들을 추출할 때마다 값이 달라지므로 사후평균 등의 결과는 달라질 것이다. 동일 결과를 원한다면, set.seed 함수를 사용하여 seed 값을 설정해주면 된다.
# MCMCpack 패키지 설치
install.packages(\'MCMCpack\')
# MCMCpack 패키지 로드
library(MCMCpack)
# 사후분포의 파라미터(사전분포를 베타 분포의 형태와 일치시키기 위해 0.5 더함)
alpha_theta <- 12 + 0.5
beta_theta <- 8 + 0.5
alpha_xi <- 4 + 0.5
beta_xi <- 11 + 0.5
# 사후분포로부터 표본 추출
set.seed(123456)
theta_samples <- rbeta(1000, alpha_theta, beta_theta)
xi_samples <- rbeta(1000, alpha_xi, beta_xi)
# theta - xi()
samples <- theta_samples - xi_samples
# 참고로 사후표본 히스토그램은 다음과 같다.
hist(samples, main=\"theta - xi 사후분포\", xlab=\"theta - xi\", breaks=50)
(c) (b)에서 구한 사후표본으로 의 사후평균, 사후표준편차, 95% 신용집합을 구하라.
사후평균 = mean(samples)
사후표준편차 = sd(samples)
library(HDInterval)
신용집합 = hdi(samples, prob=0.95)
# 결과
c(사후평균, 사후표준편차, 신용집합)
위 코드 결과에 따라 몬테 카를로 방법으로 구한 의 사후평균, 사후표준편차, 95% 신용집합은 다음과 같다.
사후평균 = 0.31
사후표준편차 = 0.15
95% 신용집합 [0.019, 0.599]
4. 참고문헌
이재용·이기재(2022), 베이즈 데이터 분석, 한국방송통신대학교출판문화원.
  • 가격20,000
  • 페이지수10페이지
  • 등록일2023.09.11
  • 저작시기2023.09
  • 파일형식한글(hwp)
  • 자료번호#1223365
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니