본문내용
표준편차 사이에 존재하는 자료의 비율은 적어도 (1-1/k2)
평균으로부터 표준편차 2배 범위 내에 최소한 관찰치 75% 포함
표준편차 3배 범위 내에 최소한 관찰치 89% 포함
탐색적 자료분석 자료를 요약하는 데 사용되는 5개 숫자요약
최소값
1사분위수(Q1)
중앙값(Q2)
3사분위수(Q3)
최대값
첨도
: 분포의 뾰족한 정도를 정규분포와 비교하여 표시
: 양의 첨도는 상대적으로 더 뾰족하고, 음의 첨도는 상대적으로 덜 뾰족한 분포임
두 변수 연관성 측정치 공분산
두 변수간의 선형적인 연관성 측정치
각 변수평균편차 제곱합을 계산한 후 이를 자료 수로 나누어준다
두 변수 연관성 측정치 상관계수
일종의 표준화한 공분산
-1에서 +1 범위 내의 값을 갖는다
0은 선형의 상관관계가 없다는 것
확률의 기본 용어
실험 : 어떤 결과를 발생시키는 행위, 실험/조사/관찰을 모두 일컬음
표본공간 : 어떤 실험에서 얻을 수 있는 모든 결과의 집합
사건 : 어떤 실험에서 가능한 한 개 또는 여러 개의 결과, 표본공간의 부분집합
확률 : 0과 1사이의 숫자로서 어떤 사건이 일어날 가능성
확률에 대한 고전적 접근방법 어떤 사건이 이론적으로 일어날 수 있는 비율
발생할 가능성이 동일한 결과들에 대해, 확률 = 어떤 사건에 속하는 결과들의 개수 / 발생 가능한 결과들의 총 개수
실제 실험을 하지 않고 확률을 정할 수 있으므로 사전적 접근이라 함
게임 상황에서 많이 활용되나 가능한 결과들의 발생 가능성이 서로 같지 않거나 실험 속에 숨어있는 그 과정이 잘 알려져 있지 않다면 실제 세계에서 잘 활용할 수 없음
ex) 주사위를 굴려 눈이 1이 나올 확률, 동전을 던져 앞면이 나올 확률
확률에 대한 상대도수 접근방법
많은 횟수로 실험을 시행할 때 어떤 사건이 발생하여 관찰되는 비율
어떤 실험을 아주 많이 시행할 때, 확률 = 어떤 사건에 속하는 시행횟수 / 총 시행횟수
대수의 법칙에 의존. 즉 아주 많이 횟수로 실험을 시행하면 어떤 사건이 일어날 상대적 빈도수는 단 한번의 시행에서 그 사건이 일어날 확률에 점점 가까워지게 됨
확률에 대한 주관적 접근방법 어떤 사건이 일어날 것인지 또는 일어나지 않을 것인지에 대해 믿게되는 정도를 나타내는 것
육감에 의한 판단 또는 경험에 의한 추측
개인의 믿음 정도에 관계없이 실험결과의 확률은 0과 1사이에 있어야 하고, 확률의 합은 1이어야 함
고전적 방법과 상대도수 방법을 주관적 방법과 결합하여 최적 확률을 추정할 수 있음
확률의 기본관계
여사건 : 사건A의 여사건은 A에 포함되지 않은 표본점들의 집합
합집합 : 사건A와 B의 합집합은 A나 B 그리고 둘다에 속하는 표본점을 가지는 사건
교집합 : 사건A와 B의 교집합은 A와 B 동시에 포함되는 표본점을 가지는 사건
덧셈법칙 : 사건A, 또는 사건B, 또는 A와 B의 확률을 계산하는 방법을 제공함
합집합 = 각각의 확률을 더하고 교집합을 뺀다
상호배반사건 : 두 사건에 공통인 표본점이 없는 사건
조건부확률 : 어느 사건이 이미 발생한 상태에서 다른 사건이 일어날 확률
주변확률 : 두 개 또는 그 이상의 사건이 동시에 일어날 수 있을 때, 하나의 특정 사건에 주목하여 그것이 일어날 확률, 다른 사건은 고려하지 않음
결합확률 : 두 개 이상의 사건이 동시에 일어날 확률, 두 사건의 교집합에 대한 확률
독립사건 : 한 사건의 발생이 다른 사건의 발생확률에 전혀 영향을 미치지 않을 때 두 사건을 서로 독립이라 하고 각각을 다른 사건에 대해 독립사건이라 함
곱셈법칙 :
베이즈정리
우리는 관심이 있는 사건의 최초확률 또는 사전확률 추정치를 가지고 분석을 시작함
그리고 표본, 보고서, 테스트 등과 같은 자료로부터 사건에 대한 추가적인 정보를 얻게 됨
이러한 새로운 정보를 알고 사전확률을 수정함으로써 사후확률이라는 확률을 계산함
베이즈정리는 이러한 사전확률을 수정하는 방법을 제공함
베이즈정리
사건B가 주어졌을 때 사건A가 일어날 사후확률을 구하기 위해 베이즈정리를 적용함
두 개 또는 여러개의 사건이 순차적으로 발생할 때 조건부 확률을 적용해서 새로 얻은 정보로 확률을 수정하는 방법
즉 어떤 사건의 사전확률을 정한 후 두 번째 사건의 발생결과에 따른 정보를 가지고 처음의 확률을 수정한 사후확률을 구함
베이즈정리는 사후확률을 계산하려는 사건들이 상호배반이며 그들의 합집합이 표본공간을 이룰 때 적용가능
확률변수
실험결과에 따라 어떤 값을 대응시키는 것
표본공간 속의 한 원소에 일정 규칙에 따라 실수값을 대응시킨 것
평균으로부터 표준편차 2배 범위 내에 최소한 관찰치 75% 포함
표준편차 3배 범위 내에 최소한 관찰치 89% 포함
탐색적 자료분석 자료를 요약하는 데 사용되는 5개 숫자요약
최소값
1사분위수(Q1)
중앙값(Q2)
3사분위수(Q3)
최대값
첨도
: 분포의 뾰족한 정도를 정규분포와 비교하여 표시
: 양의 첨도는 상대적으로 더 뾰족하고, 음의 첨도는 상대적으로 덜 뾰족한 분포임
두 변수 연관성 측정치 공분산
두 변수간의 선형적인 연관성 측정치
각 변수평균편차 제곱합을 계산한 후 이를 자료 수로 나누어준다
두 변수 연관성 측정치 상관계수
일종의 표준화한 공분산
-1에서 +1 범위 내의 값을 갖는다
0은 선형의 상관관계가 없다는 것
확률의 기본 용어
실험 : 어떤 결과를 발생시키는 행위, 실험/조사/관찰을 모두 일컬음
표본공간 : 어떤 실험에서 얻을 수 있는 모든 결과의 집합
사건 : 어떤 실험에서 가능한 한 개 또는 여러 개의 결과, 표본공간의 부분집합
확률 : 0과 1사이의 숫자로서 어떤 사건이 일어날 가능성
확률에 대한 고전적 접근방법 어떤 사건이 이론적으로 일어날 수 있는 비율
발생할 가능성이 동일한 결과들에 대해, 확률 = 어떤 사건에 속하는 결과들의 개수 / 발생 가능한 결과들의 총 개수
실제 실험을 하지 않고 확률을 정할 수 있으므로 사전적 접근이라 함
게임 상황에서 많이 활용되나 가능한 결과들의 발생 가능성이 서로 같지 않거나 실험 속에 숨어있는 그 과정이 잘 알려져 있지 않다면 실제 세계에서 잘 활용할 수 없음
ex) 주사위를 굴려 눈이 1이 나올 확률, 동전을 던져 앞면이 나올 확률
확률에 대한 상대도수 접근방법
많은 횟수로 실험을 시행할 때 어떤 사건이 발생하여 관찰되는 비율
어떤 실험을 아주 많이 시행할 때, 확률 = 어떤 사건에 속하는 시행횟수 / 총 시행횟수
대수의 법칙에 의존. 즉 아주 많이 횟수로 실험을 시행하면 어떤 사건이 일어날 상대적 빈도수는 단 한번의 시행에서 그 사건이 일어날 확률에 점점 가까워지게 됨
확률에 대한 주관적 접근방법 어떤 사건이 일어날 것인지 또는 일어나지 않을 것인지에 대해 믿게되는 정도를 나타내는 것
육감에 의한 판단 또는 경험에 의한 추측
개인의 믿음 정도에 관계없이 실험결과의 확률은 0과 1사이에 있어야 하고, 확률의 합은 1이어야 함
고전적 방법과 상대도수 방법을 주관적 방법과 결합하여 최적 확률을 추정할 수 있음
확률의 기본관계
여사건 : 사건A의 여사건은 A에 포함되지 않은 표본점들의 집합
합집합 : 사건A와 B의 합집합은 A나 B 그리고 둘다에 속하는 표본점을 가지는 사건
교집합 : 사건A와 B의 교집합은 A와 B 동시에 포함되는 표본점을 가지는 사건
덧셈법칙 : 사건A, 또는 사건B, 또는 A와 B의 확률을 계산하는 방법을 제공함
합집합 = 각각의 확률을 더하고 교집합을 뺀다
상호배반사건 : 두 사건에 공통인 표본점이 없는 사건
조건부확률 : 어느 사건이 이미 발생한 상태에서 다른 사건이 일어날 확률
주변확률 : 두 개 또는 그 이상의 사건이 동시에 일어날 수 있을 때, 하나의 특정 사건에 주목하여 그것이 일어날 확률, 다른 사건은 고려하지 않음
결합확률 : 두 개 이상의 사건이 동시에 일어날 확률, 두 사건의 교집합에 대한 확률
독립사건 : 한 사건의 발생이 다른 사건의 발생확률에 전혀 영향을 미치지 않을 때 두 사건을 서로 독립이라 하고 각각을 다른 사건에 대해 독립사건이라 함
곱셈법칙 :
베이즈정리
우리는 관심이 있는 사건의 최초확률 또는 사전확률 추정치를 가지고 분석을 시작함
그리고 표본, 보고서, 테스트 등과 같은 자료로부터 사건에 대한 추가적인 정보를 얻게 됨
이러한 새로운 정보를 알고 사전확률을 수정함으로써 사후확률이라는 확률을 계산함
베이즈정리는 이러한 사전확률을 수정하는 방법을 제공함
베이즈정리
사건B가 주어졌을 때 사건A가 일어날 사후확률을 구하기 위해 베이즈정리를 적용함
두 개 또는 여러개의 사건이 순차적으로 발생할 때 조건부 확률을 적용해서 새로 얻은 정보로 확률을 수정하는 방법
즉 어떤 사건의 사전확률을 정한 후 두 번째 사건의 발생결과에 따른 정보를 가지고 처음의 확률을 수정한 사후확률을 구함
베이즈정리는 사후확률을 계산하려는 사건들이 상호배반이며 그들의 합집합이 표본공간을 이룰 때 적용가능
확률변수
실험결과에 따라 어떤 값을 대응시키는 것
표본공간 속의 한 원소에 일정 규칙에 따라 실수값을 대응시킨 것
소개글