일상속의 확률 예시
- 내일 비가 올 확률은 80%이다.
- 흡연자는 비흡연자에 비해 폐암에 걸릴 확률이 높다.
- 2017년 한국시리즈에서 A팀에 이길 확률은?
- 로또에서 1등에 당첨 확률은?
- 확률 (probability)은 불확실한 (uncertain) 상황에서 어떤 일 (event)이 일어날 가능성 (possibility)이 얼마인지 (measure)를 알려줌
확률의 유래
17세기 프랑스의 직업 도박사 Chevalier de Méré(쉬발리에 드 메레)가 Blaise Pascal(블레즈 파스칼) 에게 준 문제
Blaise Pascal
17세기 신학자, 수학자, 철학자, 소설가, 과학자, …
팡세: 인간은 자연 가운데서 가장 약한 하나의 갈대에 불과하다. 그러나 그것은 생각하는 갈대이다.
Blaise Pascal
두 사람이 주사위 도박 게임
- A: 주사위를 4번 던져 6이 한번이라도 나오면 승리
- B: 주사위를 4번 던져 6이 한번도 나오지 않으면 승리
- A, B가 중도에 게임을 중단함
- 드 메레의 의문: 한사람이 모두 돈을 잃을 때까지 계속한다면 과연 누가 이길까? \(\Rightarrow\) (A or B?)
드 메레의 10번의 게임 예시
1 | 4 | 2 | 3 | (6) | A |
2 | 5 | 2 | (6) | 4 | A |
3 | 4 | 2 | 5 | 1 | B |
4 | 4 | 3 | (6) | 5 | A |
5 | 3 | 2 | 5 | (6) | A |
6 | 3 | 1 | 4 | (6) | A |
7 | 2 | 3 | 1 | (6) | A |
8 | 3 | 2 | 4 | 1 | B |
9 | 1 | 3 | 5 | 2 | B |
10 | 1 | 2 | (6) | 4 | A |
de Méré 문제의 답안
- 주사위(1,2,3,4,5,6)를 한번 던질 때, 6이 나올 확률 \[ P(\mbox{눈이 6})= 1/6 \]
- 주사위를 한번 던질 때, 6이 나오지 않을 확률 \[ 1 - P(\mbox{눈이 6})= 5/6 \]
- 주사위를 4번 던질 때, 6이 한번도 나오지 않을 확률 (B가 승리) \[ \frac{5}{6} \times \frac{5}{6} \times \frac{5}{6} \times \frac{5}{6} \approx 0.482253 \]
- 주사위를 4번 던질 때, 6이 최소한 한번 나올 확률 (A가 승리) \[ 1 - P(\mbox{한번도 6이 나오지 않음} ) = 1 - 0.482253 = 0.517747 \]
확률의 기원
- Pascal, Ferma가 드 메레(de Mere)의 문제를 해결
- 라플라스(Laplace), 드 므와브르(De Moivre)에 의해 발전
- 라플라스는 확률을 도박 이외의 응용분야로 적용
- 다양한 응용분야: 생물학, 의학, 경제학, 천문학, 전자, 전기 등…
확률의 정의
주사위 던지기 놀이에서 6이 나올 가능성 (10,000번 반복)
확률은 어떠한 사건의 발생 가능성을 계량화하기 위해 사용되는 일종의 척도
같은 조건에서 실험을 무한히 반복할 때, 어떤 사건이 일어나는 상대적 비율, 즉, 어떤 사건이 일어나는 상대 도수의 극한 개념 (통계적 확률의 개념)
확률 관련된 용어 정의
- 실험은 무수히 반복가능하며 실험의 조건에 따라 서로 다른 결과를 나타낸다,
- 실험의 종류
- 결정적실험 (deterministic experiment): 실험을 할 때 특정 조건에 띠라 동일한 결과가 나오는 경우
- 확률실험 (random experiment) : 동일한 조건으로 실험을 하더라도 서로 다른 결과가 나오는 경우
- 표본 공간(sample space): 확률실험에서 모든 가능한 결과의 집합, \(\Omega\) 또는 \(S\)로 표시
- 근원사건(elementary event): 표본공간의 원소
- 사건, 사상(event): 관심있는 결과의 집합, 표본공간의 부분집합, \(A, B, ...\)등으로 표시
- 사건 \(A\)가 일어날 확률: \(P(A)\)로 표시, 여기서 \(P\)를 확률함수 또는 확률
확률의 고전적 정의 (Laplace (Pierre-Simon, marquis de Laplace, 1749~1827,프랑스 수학자)의 정의)
실험의 결과가 여러 개이고, 각각의 결과들이 나올 가능성이 모두 동일할 경우
라플라스의 정의 \[ P(A) = \frac{\mbox{사건 A에 속한 원소의 개수}}{\mbox{표본공간의 원소의 개수}} \]
동전을 한번 던지는 실험
- 실험의 결과는 앞면(Head), 또는 뒷면(Tail)
- 표본공간: \(\Omega = \{H, T\}\)
- 사건 : 표본공간의 부분집합으로 아래와 같은 4가지 종류의 사건들이 있음 \[ \emptyset, \{H\}, \{T\}, \{H, T\} \]
- 각 사건들의 확률
표본공간의 다양성
- 동전을 두번 던지는 실험을 고려하자.
- 실험의 결과 1 \[ S_1 = \{HH, HT, TH, TT\} \]
- 실험의 결과 2: (앞면의 수, 뒷면의 수)로 요약할 경우 \[ S_2 = \{(2, 0), (1, 1), (0, 2)\} \]
- 결과 3: 같은 면이 나오면 1, 그렇지 않으면 0 \[ S_3 = \{0, 1\} \]
- 결과를 어떻게 바라 보느냐에 따라 동일한 실험이라 하더라도 서로 다른 표본공간으로 정의할 수 있음
확률의 법칙 : 공리에 의한 확률
- 확률의 법칙: 확률이 가져야할 최소의 조건들
- 모든 임의의 사건(\(A \subset \Omega\))에 대한 확률은 0보다 크거나 같고, 1보다 작거나 같다. \[ 0 \le P(A) \le 1,\mbox{ 모든 } A \subset \Omega \]
- 표본공간(\(\Omega\) 또는 전체 사건)에 대한 확률은 1이다. \[ P(\Omega) = 1. \]
- 서로 다른 두 사건 \(A\), \(B\)에 대하여, \(A \cap B = \emptyset\) 이면 (이를 서로 배반(mutually exclusive)이라고 함), \[ P(A \cup B) = P(A) + P(B) \]
- (참고) 엄밀히 말하면, 3번 조건은 다음 조건이어야 함
- 서로 배반인 사건들 \(A_1, A_2, A_3, \ldots\)에 대하여 (서로 다른 모든 \(i, j\) \(A_i \cap A_j = \emptyset\)), \[ P(A_1 \cup A_2 \cup A_2 \cup \ldots ) = P(A_1) + P(A_2) + P(A_3) + \ldots \]
공리적 확률 (참고)
- 구소련(현, 러시아)의 수학자 콜모고로프 (Kolmogorov)는 확률을 위의 3가지 확률의 법칙을 만족하는 함수로 정의함
콜모고로프
확률의 계산 (고전적 정의에 의한)
조합 (combination): 서로 다른 \(n\)개 중 순서에 상관없이 \(k\)개를 뽑는 방법의 수 (경우의 수)는? \[ {}_nC_k ={n \choose k} = \frac{n(n-1)\cdots (n-k+1)}{k(k-1)\cdots 1} = \frac{n!}{k!(n-k)!} \]
예:
로또 복권의 당첨 확률
- 1등 : 45개의 숫자에서 6개의 숫자가 당첨번호(6개)와 모두 일치
- 전체 경우의 수 \[ {}_{45}C_6 ={45 \choose 6} = \frac{45!}{6!(39)!} = 8,145,060 \]
- 4등 : 45개의 숫자에서 6개의 숫자가 당첨번호(6개) 중 3개가 일치
- 6개 중 3개는 당첨번호 6개 중 3개와 일치, 나머지 3개는 다른번호 (45-6)개 중 선택
- 6개 중 3개가 당첨번호 6개 중 3개와 일치하는 경우의 수 \[ {6 \choose 3} = \frac{6!}{3!(3)!} = 20 \]
- 나머지 3개가 다른번호 (45-6)개 에서 뽑히는 경우의 수 \[ {39 \choose 3} = \frac{39!}{36!(3)!} = 9139 \]
- 4등 당첨확률 \[\frac{{6 \choose 3}{39 \choose 3}}{{45 \choose 6}}\approx \frac{1}{45}\]
- 1등 : 45개의 숫자에서 6개의 숫자가 당첨번호(6개)와 모두 일치
확률의 법칙
- 합사건 : 사건 \(A\)와 \(B\)가 있을 때, \(A\) 또는 \(B\)가 일어날 사건 (\(A \cup B\)로 표시)
- 곱사건 : 사건 \(A\)와 \(B\)가 있을 때, \(A\)와 \(B\)가 동시에 일어날 사건 (\(A \cap B\)로 표시)
- 배반사건 (mutually exclusive event): 사건 \(A\)와 \(B\)가 있을 때, \(A \cap B = \emptyset\)인 경우 두 사건을 서로 배반이라고 부름
- 덧셈법칙
- 합사건의 확률 \[ P(A \cup B) = P(A) + P(B) - P(A\cap B) \]
- 배반 사건의 덧셈법칙 \[ P(A \cup B) = P(A) + P(B) \]
조건부 확률
실험의 결과와 관련된 부분 정보를 알고 있다면 실험의 결과에 대한 확률에 어떤 영향을 줄까?
조건부 확률 (conditional probability) : 사건 \(B\)가 일어났을 때, 사건 \(A\)가 일어날 확률 \[ P(A|B) = \frac{P(A\cap B)}{P(B)}, \mbox{ 단, } P(B) > 0. \]
예제: 특수 질병에 대한 새로운 치료방법의 효과
치료받음(\(T\))치료받지않음(\(T^c\)) 생존(\(S\)) 1,000 50 사망(\(S^c\)) 9,000 950 - 치료를 받을 경우 생존확률? \[ P(S|T) = \frac{P(S \cap T)}{P(T)} = \frac{1,000/11,000}{(1,000+9,000)/11,000} = \frac{1,000}{10,000}= 0.1 \]
- 치료를 받지 않을 경우 사망확률? \[ P(S^c|T^c) = \frac{P(S^c \cap T^c)}{P(T^c)} = \frac{950/11,000}{(50+950)/11,000} = \frac{950}{1,000} = 0.95 \]
곱셈법칙
조건부 확률 공식 \[ P(A|B) = \frac{P(A\cap B)}{P(B)}, \mbox{ 단, } P(B) > 0. \]
곱셈법칙 : 조건부 확률 공식으로부터 두 곱사건의 확률 계산 \[ P(A\cap B) = P(A|B) P(B) \]
곱셈법칙 예제: 의학 통계학 수강생은 모두 60명, 그 중 90%는 1학년 학생이고, 1학년 학생 중 여학생은 40%일 때, 1학년 여학생의 수는?
- \(A\): 1학년 학생
- \(F\): 여학생
- 1학년 여학생의 확률 \[ P(A \cap F) = P(F|A) P(A) = 0.4 \times 0.9 = 0.36 \]
- 1학년 여학생의 수 \[ \mbox{1학년 여학생의 확률} \times \mbox{일반 통계학 수강생 수} = 0.36 \times 60 = 21.6 \approx 22 \]
사건의 독립 (Independent Events)과 조건부 확률
서로 다른 두 사건 \(A\)와 \(B\)가 아래의 조건을 만족하면 서로 독립 (mutually independent) 이라고 한다. \[ P(A \cap B) = P(A)P(B). \]
두 사건 \(A, B\)가 서로 독립이면 아래가 성립한다.
- \(P(A|B) = P(A)\)
- \(B\)가 주어진 경우 \(A\)의 조건부 확률이 \(B\)가 주어지지 않은 경우와 동일
- 즉, \(A\)가 일어날 사건은 \(B\)가 일어날 사건과 무관함
- \(A\) 와 \(B^c\)은 서로 독립
- \(P(A|B) = P(A)\)
확률의 분할법칙
- 어떤 사건 \(B\)가 있으면, 사건 \(A\)는 \(B\)와의 곱사건(교집합)과 여사건 \(B^c\)와의 곱사건의 합으로 표현됨 \[ A = (A \cap B) \cup (A \cap B^c) \]
- 이 때, \(B\)와 \(B^c\)는 서로 배반사건: \(B \cap B^c = \emptyset\)
- 사건 \(A\)의 확률은 \[ P(A) = P(A \cap B) + P(A \cap B^c) + P((A \cap B) \cap (A \cap B^c)) = P(A \cap B) + P(A \cap B^c) \]
- 즉, 서로 배반인 사건들 (\(B_j, j=1, 2, ..., n\))이 있을 때, \(A\)의 확률 \[ P(A) = P(A \cap B_1) + P(A \cap B_2) + ... + P(A \cap B_n) = \sum_1^n P(A|B_j)P(B_j) \]
베이즈 공식 (Bayes formula)
사건 \(A\)가 일어날 때, 사건 \(B\)의 조건부 확률 \[ P(B|A) = \frac{P(B \cap A)}{P(A)} = \frac{P(A|B)P(B)}{P(A|B)P(B) + P(A|B^c)P(B^c)}. \]
사건 \(A\)가 일어날 때, 서로 배반인 사건들 \(B_j, j=1,..., n\)에 대한 확률
\[ P(B_j | A) = \frac{P(A|B_j)P(B_j)}{\sum_1^n P(A|B_j)P(B_j)}. \]즉, \[ P(B_j | A) \propto P(A|B_j)P(B_j) \]
의미: \(A\)사건이 일어난 경우, \(B_j\)가 일어날 확률은 \(P(A|B_j)\)와 \(P(B_j)\)의 곱에 비례함
- \(P(B_j|A)\): 사후확률 (posterior)
- \(P(A|B_j)\): 가능도 (likelihood)
- \(P(B_j)\): 사전확률 (prior)
- 즉, \(A\)라는 사실이 관측되고 나면 \(B_j\)에 대한 믿음의 정도는 \(B_j\)가 참인 경우의 \(A\)의 발생 가능성(가능도)과 이전의 믿음의 정도와의 곱으로 표현할 수 있다.