본문내용
흩어진 모양을 보게 되는데 이를 확률변수 X의 확률분포(probability distribution)라고 일컫는다. 가령 수학능력고사의 경우 각 학생의 시험성적을 X라 하면 이는 확률변수가 되고 80여만명의 시험성적의 흩어진 모양을 확률분포라 할 수 있다.
♣ 베르누이 시행 (Bernoulli trials)
실험의 결과가 2가지뿐인 경우를 베르누이 시행이라고 한다. 예를 들자면 동전던지기에 있어 결과가 앞면과 뒷면 2가지뿐이며, 품질검사에 있어 양품과 불량품 2가지뿐이며. 입시에서 합격과 불합격 2가지뿐이기 때문에 이 모든 예들은 베르누이 시행이라고 할 수 있다. 일반적으로 2가지 경우를 성공과 실패로 정하는데 성공인 경우 X의 값이 1이고 실패인 경우 0이라 하면 X는 확률변수이면서 베르누이 시행이다. 만약 성공확률이 p 이면 확률변수 X의 기대값은 p가 되고 분산은 p(1-p)가 되며 p=1/2일 때 분산이 1/4로 가장 큰 것을 알 수 있다. 또 이런 베르누이 시행을 독립적으로 n번 시행한다면 평균 성공횟수는 np가 됨을 알 수 있다.
▣ 평균율의 법칙에 속지 말기
어떤 사건에 대한 확률이란 그 사건이 얼마나 자주 일어날 것인가에 대한 하나의 측도이며, 만약 랜덤한 현상의 무한한 독립적 반복 시행이 가능하지 않다면 확률을 생각할 수 없다. 동전을 던져서 앞면이 나올 확률이 1/2라는 것은 동전을 무수히 많이 던져본 결과 앞면이 나타나는 횟수를 측정하였을 때 얻어진 결과를 한차례 던질 경우에 적용한 것이다(물론 대부분의 경우 1/2인 공정한 동전이라고 가정한다). 이런 확률을 근거로 흔히 평균율의 법칙을 논하게 되는데 이에 대한 오해가 많기 때문에 여기서 평균율의 법칙에 대해 잘 이해할 수 있도록 하자.
앞뒷면이 나올 확률이 같은 동전을 던지는 실험에서 앞면이 계속 100번이 나온다면 다음 시행 때에는 뒷면이 나올 가능성이 더 높은가? 만약 이 동전이 공정한 동전이라는 사실을 모른다면 100번이나 앞면이 나왔기 때문에 다음에도 앞면이 나올 확률이 뒷면보다는 높을 것이라 할 수 있다. 하지만 만약 동전이 공정하다면 현재까지 앞면이 100번 나온 것과 균형을 맞추기 위하여 다음 시행에는 뒷면이 나올 가능성이 더 커지는가? 답은 아니다 이다. 동전을 던지는 실험은 과거 시행의 결과에 영향을 받지 않는다(이를 독립시행이라 한다고 했다). 따라서 앞면이 100번 나온 것과는 무관하게 앞으로도 계속 앞면이 100회 더 나타날지도 모른다. 즉 다음 시행 때에도 역시 뒷면이 나올 확률은 여전히 1/2인 것이다. 그런데 동전던지기에 대해 정말 확률이 1/2인지 상대도수로 판단하기 위해 많은 사람들이 동전던지기를 했었다. 뷰퐁은 4,040번 던져 앞면이 2,048회 나왔으며, 칼 피어슨은 12,000번 던져 6,019번, 또 24,000번 던져 12,012번 앞면을 얻었다. 여기서 시도회수로 보면 많이 던질수록 앞면이 나타나는 횟수는 1/2에 가까워짐을 알 수 있다.
즉 어떤 사건을 오랜 동안 시행할 때 그 사건이 일어나는 평균비율이 그 사건이 일어나는 확률에 가까워지며, 이를 우리는 평균율의 법칙 (a law of average)이라 한다. 하지만 이런 "평균율"에 대해 오해해서 저지르는 실수가 우리의 일상생활에 자주 있음을 알 수 있다. 가령 도박을 할 때 밤새 내내 잃었기 때문에 평균적으로 생각하면 서로 따고 잃기가 반반이니 지속적으로 하면 어느 때는 딸 것이라는 잘못 믿다가 큰일을 당할 수 있으며, 이는 도박꾼에게만 해당되는 것은 아니다. 예전에는 남아선호사상이 지금보다 훨씬 강했기 때문에 종종 딸을 일곱 혹은 여덟을 둔 가정을 볼 수 있었다. 즉 가문의 대를 이을 아들을 얻을 때까지 자녀를 두는데 딸 서넛쯤 되면 이제까지 딸이니까 평균율에 의하면 하나쯤은 아들을 얻을 수 있으리라는 믿음으로 다시 또 아이를 갖고 해서 어느덧 딸이 일곱 혹은 여덟 가진 가정이 되는 것이다. "평균율로 본다면 이번에 딸을 낳을 가능성은 1/2보다는 훨씬 낮아질 것이며 따라서 상대적으로 아들 얻을 확률이 매우 커질 것이다(매우 모호하게 정의되어지지만)" 라는 믿음이 보통의 사람들에게 생기게 마련이다. 하지만 아이를 갖는 것은 동전을 던지는 것과 같이 서로 독립적 사건이라는 사실을 대부분은 잘 이해하지 못하거나 간과해 버리는 것이다. 계속해서 딸을 일곱이나 여덟을 낳는다는 것은 매우 드물기는 하겠지만 딸을 일곱 둔 가정에서는 또 다시 딸을 둘 가능성이 되려 높을 수도 있는 것이다. 실제로 본인이 유학 후 귀국하였을 때 부모로부터 딸 둘이 있는 가정에서는 다음에 아들일 가능성이 매우 높으니 아이를 갖지 않겠는가 하는 협박 반 권유 반을 받았는데 평균율에 대한 올바른 이해로써 어른들을 이해시킬 수가 있었다.
▶ 평균율의 법칙을 올바로 이해하기 위해 다음의 두 문장을 보자.
(a) 공정한 동전을 많이 던질 때 앞면이 나타나는 비율은 1/2에 가깝다.
(b) 공정한 동전을 많이 던질 때 앞면이 나타나는 횟수는 동전을 던진 횟수의 1/2에 가깝다.
문장 (a)는 참이며 앞면이 나타날 확률이 1/2임을 뜻한다. 그러나 문장(b)는 거짓이다. 그 이유는 공정한 동전을 많이 던질 때 앞면이 나타나는 횟수는 절반에서 크게 벗어 날 수 있기 때문이다.
이것이 사실인지를 알아보기 위해 다음의 예를 보자.
2차 세계대전 당시 영국의 수학자인 존 케리치(John Kerrich)는 동전을 던진 결과 다음을 얻었다.
동전을
던진 횟수
앞면이
나타난 횟수
앞면이
나타난 비율
앞면이 나타난 횟수와
던진 횟수의 절반과의 차
10
4
0.4000
-1
100
44
0.4400
-6
200
98
0.4900
-2
300
146
0.4866
-4
500
255
0.5100
5
1,000
502
0.5020
2
2,000
1,013
0.5065
13
3,000
1,510
0.5033
10
5,000
2,533
0.5066
33
7,000
3,516
0.5023
16
10,000
5,067
0.5067
67
앞면이 나온 확률은 1/2에 가까워지기는 하지만 앞면이 나타난 횟수와 동전을 던진 횟수의 절반과는 상당한 차이가 있다.
♣ 베르누이 시행 (Bernoulli trials)
실험의 결과가 2가지뿐인 경우를 베르누이 시행이라고 한다. 예를 들자면 동전던지기에 있어 결과가 앞면과 뒷면 2가지뿐이며, 품질검사에 있어 양품과 불량품 2가지뿐이며. 입시에서 합격과 불합격 2가지뿐이기 때문에 이 모든 예들은 베르누이 시행이라고 할 수 있다. 일반적으로 2가지 경우를 성공과 실패로 정하는데 성공인 경우 X의 값이 1이고 실패인 경우 0이라 하면 X는 확률변수이면서 베르누이 시행이다. 만약 성공확률이 p 이면 확률변수 X의 기대값은 p가 되고 분산은 p(1-p)가 되며 p=1/2일 때 분산이 1/4로 가장 큰 것을 알 수 있다. 또 이런 베르누이 시행을 독립적으로 n번 시행한다면 평균 성공횟수는 np가 됨을 알 수 있다.
▣ 평균율의 법칙에 속지 말기
어떤 사건에 대한 확률이란 그 사건이 얼마나 자주 일어날 것인가에 대한 하나의 측도이며, 만약 랜덤한 현상의 무한한 독립적 반복 시행이 가능하지 않다면 확률을 생각할 수 없다. 동전을 던져서 앞면이 나올 확률이 1/2라는 것은 동전을 무수히 많이 던져본 결과 앞면이 나타나는 횟수를 측정하였을 때 얻어진 결과를 한차례 던질 경우에 적용한 것이다(물론 대부분의 경우 1/2인 공정한 동전이라고 가정한다). 이런 확률을 근거로 흔히 평균율의 법칙을 논하게 되는데 이에 대한 오해가 많기 때문에 여기서 평균율의 법칙에 대해 잘 이해할 수 있도록 하자.
앞뒷면이 나올 확률이 같은 동전을 던지는 실험에서 앞면이 계속 100번이 나온다면 다음 시행 때에는 뒷면이 나올 가능성이 더 높은가? 만약 이 동전이 공정한 동전이라는 사실을 모른다면 100번이나 앞면이 나왔기 때문에 다음에도 앞면이 나올 확률이 뒷면보다는 높을 것이라 할 수 있다. 하지만 만약 동전이 공정하다면 현재까지 앞면이 100번 나온 것과 균형을 맞추기 위하여 다음 시행에는 뒷면이 나올 가능성이 더 커지는가? 답은 아니다 이다. 동전을 던지는 실험은 과거 시행의 결과에 영향을 받지 않는다(이를 독립시행이라 한다고 했다). 따라서 앞면이 100번 나온 것과는 무관하게 앞으로도 계속 앞면이 100회 더 나타날지도 모른다. 즉 다음 시행 때에도 역시 뒷면이 나올 확률은 여전히 1/2인 것이다. 그런데 동전던지기에 대해 정말 확률이 1/2인지 상대도수로 판단하기 위해 많은 사람들이 동전던지기를 했었다. 뷰퐁은 4,040번 던져 앞면이 2,048회 나왔으며, 칼 피어슨은 12,000번 던져 6,019번, 또 24,000번 던져 12,012번 앞면을 얻었다. 여기서 시도회수로 보면 많이 던질수록 앞면이 나타나는 횟수는 1/2에 가까워짐을 알 수 있다.
즉 어떤 사건을 오랜 동안 시행할 때 그 사건이 일어나는 평균비율이 그 사건이 일어나는 확률에 가까워지며, 이를 우리는 평균율의 법칙 (a law of average)이라 한다. 하지만 이런 "평균율"에 대해 오해해서 저지르는 실수가 우리의 일상생활에 자주 있음을 알 수 있다. 가령 도박을 할 때 밤새 내내 잃었기 때문에 평균적으로 생각하면 서로 따고 잃기가 반반이니 지속적으로 하면 어느 때는 딸 것이라는 잘못 믿다가 큰일을 당할 수 있으며, 이는 도박꾼에게만 해당되는 것은 아니다. 예전에는 남아선호사상이 지금보다 훨씬 강했기 때문에 종종 딸을 일곱 혹은 여덟을 둔 가정을 볼 수 있었다. 즉 가문의 대를 이을 아들을 얻을 때까지 자녀를 두는데 딸 서넛쯤 되면 이제까지 딸이니까 평균율에 의하면 하나쯤은 아들을 얻을 수 있으리라는 믿음으로 다시 또 아이를 갖고 해서 어느덧 딸이 일곱 혹은 여덟 가진 가정이 되는 것이다. "평균율로 본다면 이번에 딸을 낳을 가능성은 1/2보다는 훨씬 낮아질 것이며 따라서 상대적으로 아들 얻을 확률이 매우 커질 것이다(매우 모호하게 정의되어지지만)" 라는 믿음이 보통의 사람들에게 생기게 마련이다. 하지만 아이를 갖는 것은 동전을 던지는 것과 같이 서로 독립적 사건이라는 사실을 대부분은 잘 이해하지 못하거나 간과해 버리는 것이다. 계속해서 딸을 일곱이나 여덟을 낳는다는 것은 매우 드물기는 하겠지만 딸을 일곱 둔 가정에서는 또 다시 딸을 둘 가능성이 되려 높을 수도 있는 것이다. 실제로 본인이 유학 후 귀국하였을 때 부모로부터 딸 둘이 있는 가정에서는 다음에 아들일 가능성이 매우 높으니 아이를 갖지 않겠는가 하는 협박 반 권유 반을 받았는데 평균율에 대한 올바른 이해로써 어른들을 이해시킬 수가 있었다.
▶ 평균율의 법칙을 올바로 이해하기 위해 다음의 두 문장을 보자.
(a) 공정한 동전을 많이 던질 때 앞면이 나타나는 비율은 1/2에 가깝다.
(b) 공정한 동전을 많이 던질 때 앞면이 나타나는 횟수는 동전을 던진 횟수의 1/2에 가깝다.
문장 (a)는 참이며 앞면이 나타날 확률이 1/2임을 뜻한다. 그러나 문장(b)는 거짓이다. 그 이유는 공정한 동전을 많이 던질 때 앞면이 나타나는 횟수는 절반에서 크게 벗어 날 수 있기 때문이다.
이것이 사실인지를 알아보기 위해 다음의 예를 보자.
2차 세계대전 당시 영국의 수학자인 존 케리치(John Kerrich)는 동전을 던진 결과 다음을 얻었다.
동전을
던진 횟수
앞면이
나타난 횟수
앞면이
나타난 비율
앞면이 나타난 횟수와
던진 횟수의 절반과의 차
10
4
0.4000
-1
100
44
0.4400
-6
200
98
0.4900
-2
300
146
0.4866
-4
500
255
0.5100
5
1,000
502
0.5020
2
2,000
1,013
0.5065
13
3,000
1,510
0.5033
10
5,000
2,533
0.5066
33
7,000
3,516
0.5023
16
10,000
5,067
0.5067
67
앞면이 나온 확률은 1/2에 가까워지기는 하지만 앞면이 나타난 횟수와 동전을 던진 횟수의 절반과는 상당한 차이가 있다.