목차
Goal
Process
1. Binomial random variable의 실제 사례를 생각해 보고 matlab 등의 tool을 이용해 상황을 simulation한다.
2. 여러 번의 trial을 통해 실험적인 PMF와 CDF를 구하고 이론적 수식을 이용한 binomial RV의 PMF/CDF와 비교해 본다.
3. Binomial RV는 특수한 상황에서 Poisson RV로 근사할 수 있다. n과 p의 값을 조절하면서 2와 같은 방법으로 PMF와 CDF를 plot하고 Poisson RV의 PMF/CDF와 비교해 보자. Poisson으로 근사할 수 있는 조건은 무엇인가?
Process
1. Binomial random variable의 실제 사례를 생각해 보고 matlab 등의 tool을 이용해 상황을 simulation한다.
2. 여러 번의 trial을 통해 실험적인 PMF와 CDF를 구하고 이론적 수식을 이용한 binomial RV의 PMF/CDF와 비교해 본다.
3. Binomial RV는 특수한 상황에서 Poisson RV로 근사할 수 있다. n과 p의 값을 조절하면서 2와 같은 방법으로 PMF와 CDF를 plot하고 Poisson RV의 PMF/CDF와 비교해 보자. Poisson으로 근사할 수 있는 조건은 무엇인가?
본문내용
로 근사할 수 있다. 다 정리하면 Poisson RV PMF의 식은 e^(-α)*α!/x!가 된다.
<2010년 1월 1일부터 2010년 4월 5일까지 세계에서 발생한 강도 4 이상의 지진들에 대한 data가 있다. 관측자가 1일 4교대로 근무를 한다고 할 때, 한 번의 근무시간 동안 관측할 수 있는 지진의 수는 어떤 random variable에 해당할까? 수식을 이용해 PMF를 modeling해 보고, 실제 data를 분석해서 얻은 통계적 PMF와 비교해 보자. 실제 양상과 model은 잘 맞아떨어지는가? 차이가 있다면 어디서 발생한 것일까?>
-관측자의 한 번의 근무시간은 하루 6시간이다. 그리고 엄청난 횟수의 지진발생에 비해 관측자가 실제로 근무시간 중 관측할 수 있는 지진의 횟수는 평균 7.3회(α=7.3) 정도이므로 매우 적은 편이다. 발생 수는 많지만 그 관측 가능한 확률이 매우 작다는 것을 보아 지진의 수는 Poisson random variable이라고 할 수 있다. 다음의 두 PMF 그래프를 보면 X축이 커지면 거의 0이라는 점에서 비슷한 양상을 보이는데 이론적인 그래프는 곡선의 형태를 그리지만 data에 의존한 실험적 그래프는 X축이 충분히 작을 때 각 data값에 따라 들쭉날쭉한 확률을 기록하고 있다. 2월 27일 지진이 일어난 횟수는 무려 113회로 1일 일어나는 평균 지진횟수의 거의 5배였다. 또한 2월 24일의 지진발생 횟수는 6회로 평균의 1/4배이다. 이처럼 날마다 일어나는 지진의 횟수가 고르지 못하고 매우 다양하다는 사실이 실제와 수식적 PMF에 차이를 가져온 듯하다.
<2010년 1월 1일부터 2010년 4월 5일까지 세계에서 발생한 강도 4 이상의 지진들에 대한 data가 있다. 관측자가 1일 4교대로 근무를 한다고 할 때, 한 번의 근무시간 동안 관측할 수 있는 지진의 수는 어떤 random variable에 해당할까? 수식을 이용해 PMF를 modeling해 보고, 실제 data를 분석해서 얻은 통계적 PMF와 비교해 보자. 실제 양상과 model은 잘 맞아떨어지는가? 차이가 있다면 어디서 발생한 것일까?>
-관측자의 한 번의 근무시간은 하루 6시간이다. 그리고 엄청난 횟수의 지진발생에 비해 관측자가 실제로 근무시간 중 관측할 수 있는 지진의 횟수는 평균 7.3회(α=7.3) 정도이므로 매우 적은 편이다. 발생 수는 많지만 그 관측 가능한 확률이 매우 작다는 것을 보아 지진의 수는 Poisson random variable이라고 할 수 있다. 다음의 두 PMF 그래프를 보면 X축이 커지면 거의 0이라는 점에서 비슷한 양상을 보이는데 이론적인 그래프는 곡선의 형태를 그리지만 data에 의존한 실험적 그래프는 X축이 충분히 작을 때 각 data값에 따라 들쭉날쭉한 확률을 기록하고 있다. 2월 27일 지진이 일어난 횟수는 무려 113회로 1일 일어나는 평균 지진횟수의 거의 5배였다. 또한 2월 24일의 지진발생 횟수는 6회로 평균의 1/4배이다. 이처럼 날마다 일어나는 지진의 횟수가 고르지 못하고 매우 다양하다는 사실이 실제와 수식적 PMF에 차이를 가져온 듯하다.