확률 계산 공식 - hwaglyul gyesan gongsig

일상속의 확률 예시

  1. 내일 비가 올 확률은 80%이다.
  2. 흡연자는 비흡연자에 비해 폐암에 걸릴 확률이 높다.
  3. 2017년 한국시리즈에서 A팀에 이길 확률은?
  4. 로또에서 1등에 당첨 확률은?
  • 확률 (probability)은 불확실한 (uncertain) 상황에서 어떤 일 (event)이 일어날 가능성 (possibility)이 얼마인지 (measure)를 알려줌

확률의 유래

  • 17세기 프랑스의 직업 도박사 Chevalier de Méré(쉬발리에 드 메레)가 Blaise Pascal(블레즈 파스칼) 에게 준 문제

    • Blaise Pascal

    • 17세기 신학자, 수학자, 철학자, 소설가, 과학자, …

    • 팡세: 인간은 자연 가운데서 가장 약한 하나의 갈대에 불과하다. 그러나 그것은 생각하는 갈대이다.

    확률 계산 공식 - hwaglyul gyesan gongsig

    Blaise Pascal

  • 두 사람이 주사위 도박 게임

    • A: 주사위를 4번 던져 6이 한번이라도 나오면 승리
    • B: 주사위를 4번 던져 6이 한번도 나오지 않으면 승리
    • A, B가 중도에 게임을 중단함
    • 드 메레의 의문: 한사람이 모두 돈을 잃을 때까지 계속한다면 과연 누가 이길까? \(\Rightarrow\) (A or B?)

드 메레의 10번의 게임 예시

주사위1의 눈주사위2의 눈주사위3의 눈주사위4의 눈Winer
1 4 2 3 (6) A
2 5 2 (6) 4 A
3 4 2 5 1 B
4 4 3 (6) 5 A
5 3 2 5 (6) A
6 3 1 4 (6) A
7 2 3 1 (6) A
8 3 2 4 1 B
9 1 3 5 2 B
10 1 2 (6) 4 A

de Méré 문제의 답안

  • 주사위(1,2,3,4,5,6)를 한번 던질 때, 6이 나올 확률 \[ P(\mbox{눈이 6})= 1/6 \]
  • 주사위를 한번 던질 때, 6이 나오지 않을 확률 \[ 1 - P(\mbox{눈이 6})= 5/6 \]
  • 주사위를 4번 던질 때, 6이 한번도 나오지 않을 확률 (B가 승리) \[ \frac{5}{6} \times \frac{5}{6} \times \frac{5}{6} \times \frac{5}{6} \approx 0.482253 \]
  • 주사위를 4번 던질 때, 6이 최소한 한번 나올 확률 (A가 승리) \[ 1 - P(\mbox{한번도 6이 나오지 않음} ) = 1 - 0.482253 = 0.517747 \]

확률의 기원

  • Pascal, Ferma가 드 메레(de Mere)의 문제를 해결
  • 라플라스(Laplace), 드 므와브르(De Moivre)에 의해 발전
  • 라플라스는 확률을 도박 이외의 응용분야로 적용
  • 다양한 응용분야: 생물학, 의학, 경제학, 천문학, 전자, 전기 등…

확률의 정의

  • 주사위 던지기 놀이에서 6이 나올 가능성 (10,000번 반복)

    확률 계산 공식 - hwaglyul gyesan gongsig

  • 확률은 어떠한 사건의 발생 가능성을 계량화하기 위해 사용되는 일종의 척도

  • 같은 조건에서 실험을 무한히 반복할 때, 어떤 사건이 일어나는 상대적 비율, 즉, 어떤 사건이 일어나는 상대 도수의 극한 개념 (통계적 확률의 개념)

확률 관련된 용어 정의

  • 실험은 무수히 반복가능하며 실험의 조건에 따라 서로 다른 결과를 나타낸다,
  • 실험의 종류
    1. 결정적실험 (deterministic experiment): 실험을 할 때 특정 조건에 띠라 동일한 결과가 나오는 경우
    2. 확률실험 (random experiment) : 동일한 조건으로 실험을 하더라도 서로 다른 결과가 나오는 경우
  • 표본 공간(sample space): 확률실험에서 모든 가능한 결과의 집합, \(\Omega\) 또는 \(S\)로 표시
  • 근원사건(elementary event): 표본공간의 원소
  • 사건, 사상(event): 관심있는 결과의 집합, 표본공간의 부분집합, \(A, B, ...\)등으로 표시
  • 사건 \(A\)가 일어날 확률: \(P(A)\)로 표시, 여기서 \(P\)를 확률함수 또는 확률

확률의 고전적 정의 (Laplace (Pierre-Simon, marquis de Laplace, 1749~1827,프랑스 수학자)의 정의)

  • 실험의 결과가 여러 개이고, 각각의 결과들이 나올 가능성이 모두 동일할 경우

  • 라플라스의 정의 \[ P(A) = \frac{\mbox{사건 A에 속한 원소의 개수}}{\mbox{표본공간의 원소의 개수}} \]

  • 동전을 한번 던지는 실험

    • 실험의 결과는 앞면(Head), 또는 뒷면(Tail)
    • 표본공간: \(\Omega = \{H, T\}\)
    • 사건 : 표본공간의 부분집합으로 아래와 같은 4가지 종류의 사건들이 있음 \[ \emptyset, \{H\}, \{T\}, \{H, T\} \]
    • 각 사건들의 확률

표본공간의 다양성

  • 동전을 두번 던지는 실험을 고려하자.
    • 실험의 결과 1 \[ S_1 = \{HH, HT, TH, TT\} \]
    • 실험의 결과 2: (앞면의 수, 뒷면의 수)로 요약할 경우 \[ S_2 = \{(2, 0), (1, 1), (0, 2)\} \]
    • 결과 3: 같은 면이 나오면 1, 그렇지 않으면 0 \[ S_3 = \{0, 1\} \]
  • 결과를 어떻게 바라 보느냐에 따라 동일한 실험이라 하더라도 서로 다른 표본공간으로 정의할 수 있음

확률의 법칙 : 공리에 의한 확률

  • 확률의 법칙: 확률이 가져야할 최소의 조건들
    1. 모든 임의의 사건(\(A \subset \Omega\))에 대한 확률은 0보다 크거나 같고, 1보다 작거나 같다. \[ 0 \le P(A) \le 1,\mbox{ 모든 } A \subset \Omega \]
    2. 표본공간(\(\Omega\) 또는 전체 사건)에 대한 확률은 1이다. \[ P(\Omega) = 1. \]
    3. 서로 다른 두 사건 \(A\), \(B\)에 대하여, \(A \cap B = \emptyset\) 이면 (이를 서로 배반(mutually exclusive)이라고 함), \[ P(A \cup B) = P(A) + P(B) \]
    4. (참고) 엄밀히 말하면, 3번 조건은 다음 조건이어야 함
      • 서로 배반인 사건들 \(A_1, A_2, A_3, \ldots\)에 대하여 (서로 다른 모든 \(i, j\) \(A_i \cap A_j = \emptyset\)), \[ P(A_1 \cup A_2 \cup A_2 \cup \ldots ) = P(A_1) + P(A_2) + P(A_3) + \ldots \]

공리적 확률 (참고)

  • 구소련(현, 러시아)의 수학자 콜모고로프 (Kolmogorov)는 확률을 위의 3가지 확률의 법칙을 만족하는 함수로 정의함

확률 계산 공식 - hwaglyul gyesan gongsig

콜모고로프

확률의 계산 (고전적 정의에 의한)

  • 조합 (combination): 서로 다른 \(n\)개 중 순서에 상관없이 \(k\)개를 뽑는 방법의 수 (경우의 수)는? \[ {}_nC_k ={n \choose k} = \frac{n(n-1)\cdots (n-k+1)}{k(k-1)\cdots 1} = \frac{n!}{k!(n-k)!} \]

  • 예:

    확률 계산 공식 - hwaglyul gyesan gongsig

  • 로또 복권의 당첨 확률

    • 1등 : 45개의 숫자에서 6개의 숫자가 당첨번호(6개)와 모두 일치
      • 전체 경우의 수 \[ {}_{45}C_6 ={45 \choose 6} = \frac{45!}{6!(39)!} = 8,145,060 \]
    • 4등 : 45개의 숫자에서 6개의 숫자가 당첨번호(6개) 중 3개가 일치
      • 6개 중 3개는 당첨번호 6개 중 3개와 일치, 나머지 3개는 다른번호 (45-6)개 중 선택
      • 6개 중 3개가 당첨번호 6개 중 3개와 일치하는 경우의 수 \[ {6 \choose 3} = \frac{6!}{3!(3)!} = 20 \]
      • 나머지 3개가 다른번호 (45-6)개 에서 뽑히는 경우의 수 \[ {39 \choose 3} = \frac{39!}{36!(3)!} = 9139 \]
      • 4등 당첨확률 \[\frac{{6 \choose 3}{39 \choose 3}}{{45 \choose 6}}\approx \frac{1}{45}\]

확률의 법칙

  • 합사건 : 사건 \(A\)\(B\)가 있을 때, \(A\) 또는 \(B\)가 일어날 사건 (\(A \cup B\)로 표시)
  • 곱사건 : 사건 \(A\)\(B\)가 있을 때, \(A\)\(B\)가 동시에 일어날 사건 (\(A \cap B\)로 표시)
  • 배반사건 (mutually exclusive event): 사건 \(A\)\(B\)가 있을 때, \(A \cap B = \emptyset\)인 경우 두 사건을 서로 배반이라고 부름
  • 덧셈법칙
    • 합사건의 확률 \[ P(A \cup B) = P(A) + P(B) - P(A\cap B) \]
    • 배반 사건의 덧셈법칙 \[ P(A \cup B) = P(A) + P(B) \]

조건부 확률

  • 실험의 결과와 관련된 부분 정보를 알고 있다면 실험의 결과에 대한 확률에 어떤 영향을 줄까?

  • 조건부 확률 (conditional probability) : 사건 \(B\)가 일어났을 때, 사건 \(A\)가 일어날 확률 \[ P(A|B) = \frac{P(A\cap B)}{P(B)}, \mbox{ 단, } P(B) > 0. \]

  • 예제: 특수 질병에 대한 새로운 치료방법의 효과

    치료받음(\(T\))치료받지않음(\(T^c\))
    생존(\(S\)) 1,000 50
    사망(\(S^c\)) 9,000 950
    1. 치료를 받을 경우 생존확률? \[ P(S|T) = \frac{P(S \cap T)}{P(T)} = \frac{1,000/11,000}{(1,000+9,000)/11,000} = \frac{1,000}{10,000}= 0.1 \]
    2. 치료를 받지 않을 경우 사망확률? \[ P(S^c|T^c) = \frac{P(S^c \cap T^c)}{P(T^c)} = \frac{950/11,000}{(50+950)/11,000} = \frac{950}{1,000} = 0.95 \]

곱셈법칙

  • 조건부 확률 공식 \[ P(A|B) = \frac{P(A\cap B)}{P(B)}, \mbox{ 단, } P(B) > 0. \]

  • 곱셈법칙 : 조건부 확률 공식으로부터 두 곱사건의 확률 계산 \[ P(A\cap B) = P(A|B) P(B) \]

  • 곱셈법칙 예제: 의학 통계학 수강생은 모두 60명, 그 중 90%는 1학년 학생이고, 1학년 학생 중 여학생은 40%일 때, 1학년 여학생의 수는?

    • \(A\): 1학년 학생
    • \(F\): 여학생
    • 1학년 여학생의 확률 \[ P(A \cap F) = P(F|A) P(A) = 0.4 \times 0.9 = 0.36 \]
    • 1학년 여학생의 수 \[ \mbox{1학년 여학생의 확률} \times \mbox{일반 통계학 수강생 수} = 0.36 \times 60 = 21.6 \approx 22 \]

사건의 독립 (Independent Events)과 조건부 확률

  • 서로 다른 두 사건 \(A\)\(B\)가 아래의 조건을 만족하면 서로 독립 (mutually independent) 이라고 한다. \[ P(A \cap B) = P(A)P(B). \]

  • 두 사건 \(A, B\)가 서로 독립이면 아래가 성립한다.

    1. \(P(A|B) = P(A)\)
      • \(B\)가 주어진 경우 \(A\)의 조건부 확률이 \(B\)가 주어지지 않은 경우와 동일
      • 즉, \(A\)가 일어날 사건은 \(B\)가 일어날 사건과 무관함
    2. \(A\)\(B^c\)은 서로 독립

확률의 분할법칙

  • 어떤 사건 \(B\)가 있으면, 사건 \(A\)\(B\)와의 곱사건(교집합)과 여사건 \(B^c\)와의 곱사건의 합으로 표현됨 \[ A = (A \cap B) \cup (A \cap B^c) \]
  • 이 때, \(B\)\(B^c\)는 서로 배반사건: \(B \cap B^c = \emptyset\)
  • 사건 \(A\)의 확률은 \[ P(A) = P(A \cap B) + P(A \cap B^c) + P((A \cap B) \cap (A \cap B^c)) = P(A \cap B) + P(A \cap B^c) \]
  • 즉, 서로 배반인 사건들 (\(B_j, j=1, 2, ..., n\))이 있을 때, \(A\)의 확률 \[ P(A) = P(A \cap B_1) + P(A \cap B_2) + ... + P(A \cap B_n) = \sum_1^n P(A|B_j)P(B_j) \]

베이즈 공식 (Bayes formula)

  • 사건 \(A\)가 일어날 때, 사건 \(B\)의 조건부 확률 \[ P(B|A) = \frac{P(B \cap A)}{P(A)} = \frac{P(A|B)P(B)}{P(A|B)P(B) + P(A|B^c)P(B^c)}. \]

  • 사건 \(A\)가 일어날 때, 서로 배반인 사건들 \(B_j, j=1,..., n\)에 대한 확률
    \[ P(B_j | A) = \frac{P(A|B_j)P(B_j)}{\sum_1^n P(A|B_j)P(B_j)}. \]

  • 즉, \[ P(B_j | A) \propto P(A|B_j)P(B_j) \]

  • 의미: \(A\)사건이 일어난 경우, \(B_j\)가 일어날 확률은 \(P(A|B_j)\)\(P(B_j)\)의 곱에 비례함

    • \(P(B_j|A)\): 사후확률 (posterior)
    • \(P(A|B_j)\): 가능도 (likelihood)
    • \(P(B_j)\): 사전확률 (prior)
    • 즉, \(A\)라는 사실이 관측되고 나면 \(B_j\)에 대한 믿음의 정도는 \(B_j\)가 참인 경우의 \(A\)의 발생 가능성(가능도)과 이전의 믿음의 정도와의 곱으로 표현할 수 있다.