수학 채널

목표 : 확률을 수학적으로 정의하기.



우리가 현실에서 쓰는 확률 개념에 사칙 연산 등의 각종 수학적 행위를 엄밀하게 하기 위해서는 무엇을 확률이라고 할 수 있는지, 확률은 무엇인지를 엄밀하게 정의해야 한다. 특히, 엄밀한 정의는 논리적인 증명을 할 때의 가장 기초적인 부분이기 때문이다. 


수학자들은 우리가 사용하는 현실의 확률 개념도 수학적으로 엄밀하게 모델링하여 공리화를 했다. 공리화를 함으로써, 확률 개념에 대한 각종 성질을 현실과 상관 없이 논증할 수 있게 되었다. 그리고 이러한 확률론은 당연히 통계학이나 열역학 등의 무작위성을 논하는 경우와 매우 밀접한 학문이다. 


참고로, 확률의 수학적 정의는 측도론과 관련이 있다. 그리고 수준 높은 확률론은 르베그 적분을 사용한다. 

그래서 측도론을 먼저 배운 뒤에 확률론을 배우면 개념들이 좀 친숙하게 다가올 수 있다. (혹은 그 개념들이 왜 그렇게 정의되어야 하는지에 대해 motivation을 쉽게 생각할 수 있다.)


굳이 고교 과정 수준의 확률은 굳이 측도론을 쓰지 않아도 되지만, 측도론을 쓰면 보다 높은 수준의 확률론을 다룰 수 있으니 측도론의 기본적인 개념들에 대해 살짝 설명하고 확률론에 들어가자. (참고로, 이렇게 접근하는 이유는 확률의 개념을 적당히 추상적으로 넓히면서 논리적 비약이 생기지 않게 정의를 하기 위함이다.)

평범한 고등학생이 읽기에는 좀 이해하는데 시간이 걸릴 수 있으니 숨 한 번 고르고 차분하게 읽어 보자. 


공집합 기호는 { } 라고 쓰겠다. 

두 집합 A, B에 대해, A-B 는 B의 원소가 A의 원소를 모두 모아 놓은 집합(차집합)이다.

그리고 집합으로 이루어진 수열 A1A2A3, ... 에 대해, A = A1 ∪ A2 ∪ A3 ∪ … 이라는 표현은, A={x | 어떤 자연수 k에 대해, x∈Ak}라는 의미다. 합집합 개념이니 그렇게 어려운 개념은 아니다. 


0. 서로소(disjoint)


두 집합 A, B에 대해, A∩B={ }라면, A와 B를 서로소(disjoint)라고 한다. 


S를 모든 원소가 집합인 집합이라고 하자.  

그러면, (임의의 서로 다른 S의 두 원소 A, B에 대해, A와 B가 disjoint)라면, S의 원소들이 pairwise disjoint하다고 한다. 



1. 시그마-대수 (σ-algebra) 


S를 집합, F⊂{x | x⊂S}   (즉, F의 모든 원소는 S의 부분집합이다. F가 S의 멱집합의 멱집합의 원소라고도 한다.)

그러면, (S, F)가 다음의 성질을 모두 만족할 때, F를 S의 시그마-대수 (σ-algebra)라고 한다. 

   1) S는 F의 원소이다. 

   2) F의 모든 원소 A에 대해, (S-A)는 F의 원소이다.   (여집합 연산에 대해 닫힘.)

   3) F의 원소로 이루어진 수열 A1A2A3, ... 에 대해, A = A1 ∪ A2 ∪ A3 ∪ … 은 F의 원소이다. (countable union에 대해 닫힘.)


그리고 F가 S의 시그마-대수이면,  F의 원소들을 가측 집합(measurable set), (S, F)를 가측 공간(measurable space)이라고 한다. 


Lemma) F가 S의 시그마-대수 (σ-algebra)라면, 공집합은 F의 원소이다. 


(이거 증명 못하겠으면, 이해 못 한 거다. 1) 과 2)를 이용하면 바로 나온다. )


Lemma) 임의의 집합 S에 대해, S의 시그마-대수는 존재한다. 


(가장 작은 시그마-대수는 {공집합, S} 이고, 가장 큰 시그마-대수는 {x | x⊂S} 이다. )





2. 측도(measure)


R*={x | x는 실수}∪{∞} 라고 하고,   (∞은 양의 무한을 의미한다. 그리고 임의의 R*의 원소 x에 대해, x+∞=∞, x≤으로 정의한다.)

(S, F)를 가측 공간(measurable space), m을 F에서 R* 로 가는 함수라고 하자. 

그러면, (S, F, m)이 다음의 성질을 모두 만족할 때, m을 (S, F)에 대한 measure라고 한다. 

    1) F의 모든 원소 E에 대해, m(E)≥0    (non-negativity)

    2) m( { } )= 0    (공집합의 함숫값은 0)

    3) pairwise disjoint한 F의 원소들의 수열 A1A2A3, ... 에 대해, A = A1 ∪ A2 ∪ A3 ∪ … 라고 하면, m(A)=∑m(Ak)  (k=1에서 무한)이다.  (가산합)



Lemma) (S, F)를 measurable space라고 하자. 그러면, (S, F)에 대한 measure는 존재한다. 



(존재성 증명은 매우 간단하다. 그냥 F의 모든 원소의 measure 값을 0으로 줘도 된다.)


P.S) 굳이 시그마-대수에서 measure를 찾는 이유는, measure를 well-define 하기 위함이다. 만약, F가 countable union에 대해 닫혀있지 않다면, 3)의 조건이 성립하지 않을 수 있다. 왜냐하면, 정의역에 속하지 않는 원소에 대해 함숫값은 정의되지 않기 때문이다. 그리고 공역에 무한을 추가한 것도 well-define을 하기 위함이다. 이렇게 무한을 추가한 집합에서는 수열의 무한 급수의 값이 무한으로 가는 경우도 수렴한다고 할 수 있다. 



3. 측도 공간 (measure space)


(S, F, m)이 다음의 조건을 만족하면, (S, F, m)을 측도 공간(measure space)라고 한다. 

    1) S는 집합이다. 

    2) F는 S의 시그마-대수이다. 

    3) m은 (S, F)의 측도(measure)이다. 

    

즉, (S, F)라는 measurable space에 m이라는 measure가 주어지면, measure space가 된다는 것이다. 




드디어 확률을 수학적으로 다룰 차례이다. 


4. 확률 공간(probability space)


P(S)=1인 측도 공간 (S, F, P)를 확률 공간(probability space)이라고 한다.  (정말 간단하다.)



위 정의가 너무 간단해서 직관적으로 받아들이기 힘들다면, 다음과 같이 좀 복잡하게 할 수도 있다. 


(S, F)가 가측 공간(measurable space), P를 F에서 실수 집합으로 가는 함수라고 한 뒤에 다음의 3가지 공리를 만족하면 (S, F, P)를 확률 공간이라고 정의할 수도 있다. 


공리 1) F의 모든 원소 E에 대해, P(E)≥0

공리 2) P(S)=1    

공리 3) pairwise disjoint한 F의 원소들의 수열 A1A2A3, ... 에 대해, A = A1 ∪ A2 ∪ A3 ∪ … 라고 하면, P(A)=∑P(Ak)  (k=1에서 무한)이다. 



공리 3은 그냥, 동시에 발생하는 게 불가능한 사건들 중 하나가 일어날 확률은 각각의 사건의 확률들을 더한 합과 같다는 의미이다. 

이 공리 3에서, 3 이상의 모든 정수 k에 대해, E_k를 공집합으로 놓으면, 서로소인 두 원소 E_1, E_2에 대해, P(E_1∪E_2)=P(E_1)+P(E_2)가 된다. 

그리고 좀 더 간단한 확률론에서는 공리 3을 countable sum이 아니라 그냥 finite sum으로 조건을 약화시켜서 보기도 한다. 




확률의 간단한 성질)  (S, F, P)를 확률 공간(probability space)라고 하자. 

   1) F의 모든 원소 E에 대해, P(E)≤1 이다. 

   2) F의 모든 원소 A, B에 대해, A⊂B이면, P(A)≤P(B) 이다.

   3) P({ })=0

   4) F의 모든 원소 A, B에 대해, P(AUB)=P(A)+P(B)-P(A∩B)


이 간단한 성질들은 개념을 본 첫날에 보통 하게 되는 증명이다. 





(이래서 측도론과 르베그 적분을 배워야 합니다.)


궁금하거나 이상한 거 있으면 말씀해 주세요.