2022년 2학기 방송통신대 베이즈데이터분석 기말과제물)밀도함수를 따르는 랜덤 숫자를 합격-불합격 방법으로 생성하고자 한다 분할추출법을 이용하여 표본을 추출 스탠을 이용하여 사후표본을 추출 마르코프 체인이 수렴했는지 판단 등
본 자료는 1페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
해당 자료는 1페이지 까지만 미리보기를 제공합니다.
1페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

2022년 2학기 방송통신대 베이즈데이터분석 기말과제물)밀도함수를 따르는 랜덤 숫자를 합격-불합격 방법으로 생성하고자 한다 분할추출법을 이용하여 표본을 추출 스탠을 이용하여 사후표본을 추출 마르코프 체인이 수렴했는지 판단 등에 대한 보고서 자료입니다.

목차

1. (10점) 밀도함수를 따르는 랜덤 숫자를 합격-불합격 방법으로 생성하고자 한다. 다음의 질문에 답하시오.

(a) 밀도함수의 개형을 R을 이용해 그리시오.
(b) 의 최대값을 구하시오.
(c ) 를 제안밀도함수로 하여 합격-불합격 방법 알고리듬을 서술하시오.
(d) 위에서 서술한 알고리듬으로 5000개의 랜덤표본을 R을 이용해 에서 추출하고, 히스토그램을 그리시오. 표본평균과 표본 표준편차를 구하시오.

2. (10점) 에서 분할추출법을 이용하여 표본을 추출하고자 한다. 다음에 답하시오.

(a) 책의 예 9-4를 참고하여 분할추출 알고리듬을 서술하시오.
(b) 5000개의 표본을 추출하고 히스토그램을 그리시오. 표본평균과 표본 표준편차를 구하시오.

3. (10점) 10명의 대한민국 남자들의 머리둘레와 발길이가 다음과 같이 주어졌다.

머리둘레 57.8, 58.6, 60.8, 57.6, 58.1, 60.4, 56.7, 60.0, 56,7, 54.3
발길이 27.2, 26.8, 29.9, 28.0, 27.8, 26.7, 30.8, 27.1, 26.5, 27.9

위의 데이터가 를 따른다고 하자. 각 모수의 사전분포가 를 따른다고 할 때, 스탠을 이용하여 사후표본을 추출하고자 한다. 다음의 질문에 답하시오.

(a) 스탠을 이용하여 번인 5000개를 포함하여 총 15,000개의 사후표본을 추출하시오.
(b) 모수들의 사후표본의 밀도함수 그림, 시계열 그림, 자기상관계수 그림을 그리고 마르코프 체인이 수렴했는지 판단하시오. 수렴하지 않았다고 판단하면 수렴했다고 판단할 때까지 사후표본의 크기를 늘리시오.
(c) 모수들의 사후평균, 사후표준편차, 95% 신용구간을 구하시오.

4.(20점) 다음은 10명의 남성들의 2라운드 골프 기록이다.

1라운드 92, 91, 85, 93, 87, 82, 100, 108, 82, 87
2라운드 93, 86, 88, 83, 79, 77, 108, 110, 85, 88

위의 데이터에 다음의 모형을 적합하고자 한다.

와 는 i번째 남성의 1라운드와 2라운드 기록을 나타낸다. 다음의 질문에 답하시오.

(a) 위 데이터의 산점도를 그리시오.
(b) 위 모형을 적합하기 위한 스탠과 R 코드를 작성하고, 사후표본을 구하시오.
(c) 모수들의 사후표본의 밀도함수 그림, 시계열 그림, 자기상관계수 그림을 그리고 마르코프 체인이 수렴했는지 판단하시오. 수렴하지 않았다고 판단하면 수렴했다고 판단할 때까지 사후표본의 크기를 늘리시오.
(d) 의 베이즈 추정량을 구하고, 기록의 예측식을 써라.
(e) 의 95% 신용구간을 구하라.
(f) 1라운드 기록이 84인 남성이 있었다고 한다. 이 남성의 2라운드 기록을 예측해보시오. 이 남성의 2라운드 기록의 베이즈 추정량을 구하고, 95% 예측구간을 구하시오. 확률변수의 신용구간은 예측구간이라 한다.

5. 참고문헌

본문내용

2022년 2학기 방송통신대 베이즈데이터분석 기말과제물)밀도함수를 따르는 랜덤 숫자를 합격-불합격 방법으로 생성하고자 한다 분할추출법을 이용하여 표본을 추출 스탠을 이용하여 사후표본을 추출 마르코프 체인이 수렴했는지 판단 등
베이지안 추론의 핵심은 관측값이 주어졌을 때 모수 의 사후분포를 구하는 것이다. 그러나 모형이 복잡하거나 모수의 수가 많으면 를 수리적으로 구할 수 없다. 따라서 사후분포의 사후평균, 사후분산, 특정 사건에 대한 사후확률 등을 근사적으로 계산할 필요가 있다. 이때 사후분포의 특성을 근사적으로 구하기 위해 마르코프 체인 몬테칼로(Markov Chain Monte Carlo, MCMC) 기법이 많이 사용된다. MCMC 기법은 마르코프체인을 이용하여 사후분포로부터 표본을 생성하고 이 사후표본을 사용하여 사후추론을 수행하는 방법이다. 깁스 추출법, 메트로폴리스-헤이스팅스 알고리듬, 해밀턴 몬테 카를로 등이 대표적인 MCMC 기법이다.

단순한 모델의 경우 R의 기본적인 함수(lm, glm 등)를 사용하여 매개변수를 추정할 수 있고, 복잡한 모델의 경우에도 기존 R 패키지를 사용하면 문제를 해결할 수 있는 경우도 있다. 그러나 패키지와 함수별로 사용 방법이 달라서 이를 충분히 인지해야 하고, 패지지와 함수 중에서 적절한 모델을 찾는 노력도 중요하다. 특히 적절한 모델 지원이 되지 않는 경우에는 분석 자체를 진행할 수 없게 된다. 이처럼 R 패키지가 모델 확장성이 낮다는 단점에 대응하기 위해 등장한 것이 Stan, WinBUGS, JAGS 등의 확률적 프로그래밍 언어라고 할 수 있다.
  • 가격15,000
  • 페이지수4페이지
  • 등록일2022.11.14
  • 저작시기2022.11
  • 파일형식압축파일(zip)
  • 자료번호#1189769
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니