확률론

푹 찍어 먹는 확률론 4-2 확률 변수(Random Variable)

juhongyee 2025. 5. 7. 00:59
반응형

서론

이번 시간에는 간단히 Random Variable에 대해 알아보겠습니다.

우리는 평소에 정확한 정의 없이 이를 사용하곤 하는데요, 이번엔 이를 확실하게 정의하고 넘어가 보겠습니다.

 

간단하게 요약해 보면, 확률은 사실 사건을 측정한 것입니다. 여기서 확률변수란 그 측정에 대한 함수, 즉, measurable function을 의미합니다.

(읽어도 모르겠다구요? 그럼 그냥 외워.라고 할 뻔.)

 

간단히 예시만 들고 넘어가 봅시다.

Step Function

 

실수축 위에서 0부터 3까지의 길이를 측정해 봅시다. 혹은, 함수 높이는 1, 밑변은 3짜리 직사각형의 넓이를 측정한다고 해봅시다. 그럼 $\int_{[0,3]} 1 dx$을 구한다고 생각해 볼 수 있겠죠?

그러면 위의 step function을 $\mathcal{f}$라고 해봅시다. 이 $\mathcal{f}$의 넓이를 측정한다는 건 가중치를 곱해서 $\int_{[0,3]} 1 dx$를 측정하는 것과 같습니다.

 

(계산)

0에서 1까지의 넓이를 측정한 후 1을 곱하고 1에서 2까지의 넓이를 측정한 후 2를 곱하고 2에서 3까지의 넓이를 측정한 후 3을 곱해서 다 더하는 개념입니다. 즉 넓이는 Lebegue measure를 사용할 경우 6이라고 할 수 있겠습니다. 더불어, 넓이를 구했으니 Step Function은 측정 가능한 함수라고 할 수 있겠습니다.

 

measurable function이란 측정가능한 함수로서 위의 과정이 좀 더 확장된 버전에서도 작동할 수 있게 하는 함수들을 의미합니다. 그것이 작동하려면 어떤 조건이 필요할까요?

본론에서 알아봅시다.

 

본론

먼저 Measurable Function의 정의부터 알아봅시다.

1) Definition of Random Variable

Let $(\Omega,\mathcal{F})$ be an event space.
A real valued function $X : \Omega \rightarrow \mathbb{R}$ is a r.v,
if $\forall A \in B(\mathbb{R}), (X \in A) \in \mathcal{F}$.
$(X \in A) = X^{-1}(A) = \{ \omega : X(\omega) \in A\}$

 

확률변수의 정의는 위와 같이 이루어집니다. 여기서 먼저 알아야 할 건 새로운 표현인데요. $(X \in A)$라는 표현입니다. 앞으로 설명 없이 쓸 표현이고, $X$라는 함수를 씌웠을 때 그 값이 $A$에 들어가는 $\omega$들을 모은 것, 즉, preimage를 의미하는 것입니다.

 

Measurable function은 $\mathbb{R}$의 $\sigma$-field의 element들마다 preimage가 $\Omega$의 $\sigma$-field인 $\mathcal{F}$에 속한다는 뜻입니다.

그러니까, y축에서 measurable하게 set을 잡고 preimage를 쓰면 그 x들은 확실히 measurable 하다는 거죠. 이 정의는 Integration을 가능하게 하는데 서론에서 이야기한 넓이를 측정하는 걸 가능케 합니다. 왜냐면 이제 X축을 자르는 게 아니라 Y축을 자를 거거든요. ㅎㅎ

 

확률변수가 왜 Preimage로 정의되었느냐는 저도 확실한 답변을 내기는 어렵습니다. Topological 함수도 Preimage 정의되는 걸로 아는데 preimage가 굉장히 좋은 성질들을 가지고 있기 때문이 아닐까? 정도로 생각을 했습니다.

 

정리하자면, 확률변수는 그냥 $\mathbb{R}$로 가는 measurable function입니다. measurable set을 X로 preimage를 구하면 그 집합도 measurable합니다!

 

2) Theorem

Let $\tau$ be any subsets of $B(\mathcal{R})$ s.t $\sigma(\tau) = B(\mathbb{R})$.
Then X is r.v if $\forall B \in \tau (X \in B) \in \mathcal{F}$

 

이 정리는 증명을 건너뛰더라도 의미가 굉장히 중요한 정리입니다.

어떤 collection이 그의 smalleast $\sigma$-field가 $B(\mathbb{R})$과 같다면 그냥 그 collection의 집합들에서만 random variable의 성질이 만족해도 된다는 겁니다.

 

즉 모든 집합에서 체크할 필요가 없이, 편의상 표현하자면 $\sigma$를 씌웠을 때 borel $\sigma$-field가 되는 애들에서만 보면 된다는 것이죠.

예를 들어, open sets, open intervals, half open invervals, closed intervals 각각에서만 성립해도 된다는 겁니다.

정말 맛있죠?

 

Proof)

Suppose $\forall B \in \tau ,\space (X \in B) \in \mathcal{F}$.

$\tau$에 있는 set들은 모두 measurable합니다.

 

그리고 다음의 게시글을 참고해 봅시다.

https://juhongyee.tistory.com/44

 

소소하게 얻어낸 지식 - preimage of 𝜎-algebra's Intersection

서론과제 1번이 Durret 확률론 책의 1.3.1번이었는데요. 문제를 풀다보니 제가 잘못된 풀이를 했었습니다.본 포스팅에서는 그 풀이 과정에서 얻어낸 지식을 나누고자 합니다. 다음 Stack exchange의 도

juhongyee.tistory.com

 

$\sigma(X) = \{A \subset \mathbb{R} : (X \in A) \in \mathcal{F} \}$ 로 정의합시다. 의미는 $\mathbb{R}$에서 Random Varianble X의 preimage가 measurable한 것들을 모아놓은 것입니다.

꼭 $B(\mathbb{R})$일 필요는 없겠죠? 왜냐하면 $B(\mathbb{R})$의 집합들에만 preimage가 $\mathcal{F}$에 속하면 된다고 했지 그 외 집합들이 속하면 안 된다고 정의하지는 않았기 때문이에요.

 

우리가 증명할 것은 $\sigma(X)$가 $\sigma$-field라는 것입니다.

 

$\sigma$-field의 정의를 따라가며 하나하나 증명해 봅시다.

 

1) Trivially, $\sigma(X) \in \mathbb{R}$입니다. ($\mathbb{R} \in B(\mathbb{R})$)

 

2) $(X \in A) \in \mathcal{F}$라고 해봅시다.

$(X \in A) = X^{-1}(A)$이므로 preimage property에 따라, $(X \in A^c) = (X^{-1}(A))^c$입니다.

즉, complement에 닫혀있습니다.

 

3) $A_1,A_2,...$에 대해 $(X \in A_i) \in \mathcal{F}$라고 해봅시다.

진짜 간단하므로 자세한 건 독자님들께 맡기겠습니다...!!

그러면 Preimage Propertie에 의해 $(X \in \bigcup_{i} A_i) \in \mathcal{F}$입니다.

즉, Countable union에 닫혀있습니다.

 

$\therefore \sigma(X)$ is a $\sigma$-field.

 

By assumption, $\tau \subset \sigma(X) \Rightarrow \sigma(\tau) \subset \sigma(X)$.

 

$\sigma(X)$ 를 $\sigma$-field generated by $X$라고 부릅니다.  $\sigma(X)$가 $\sigma$-field인데, 가정상(첫번째 줄) $\tau$를 항상 포함하니, $\sigma(X)$는 $\tau$를 포함하구요, $\sigma(\tau)$는 $\tau$를 포함하는 가장 작은 $\sigma$-field이니 $\sigma(X)$는 이를 포함하게 됩니다. 그런데 우리 가정에서 $\sigma(\tau) = B(\mathbb{R})$이라고 하였으니,$B(\mathbb{R}) \subset \sigma(X)$입니다.

 

즉, $\tau$에 속하는 집합들에서만 preimage가 measurable하더라도 $\sigma(\tau) = B(\mathbb{R})$의 모든 집합들이 $\sigma(X)$에 속하게 됩니다.

그리고 $\sigma(X)$는 X가 measurable하게 만들 수 있는 set들의 집합이고 그것이 $B(\mathbb{R})$을 포함하니 random variable의 정의에 따라 X는 random variable이라고 할 수 있겠습니다.

 

예컨대, open intervals의 $\sigma$-field는 $B(\mathbb{R})$와 같으므로 open intervals에서만 preimage가 measurable해도 r.v.가 된다는 걸 알 수 있겠습니다.

혹은 $(X \leq a)$에서만 잘 성립을 해도 되는데요. C.D.F가 잘 존재하면 random variable이 된다는 것도 생각해 볼 수 있겠습니다.

 

3) Random Vector

$X$ is a random vector iff each $X_i$ is a r.v s.t $X^{-1}[(-\infty,a_1) \times (-\infty,a_2) \times ... (-\infty,a_d)] = \bigcap_{i=1}^d (X_i < a_i)$

 

원래 이 부분이 Theorem인데 그냥 간단하게 설명만 하겠습니다. $X_i$들이 각기 다른 probability space가 아니라 하나의 probability space를 공유하는 상황입니다. 그러니까 예를 들어, $x$의 대한 vector $(x^2, sin(x), cos(x), e^x)$가 있는 형식인 거죠.

 

그러니까 preimage 관점에서 생각해 보면 변수 2개만 생각했을 때, $X^{-1}[A \times B)]$는 첫 번째 변수는 A에 속하게 하고 두 번째 변수는 B에 속하게 하는 모든 $\omega$들의 집합이 됩니다. 그러니까 두 조건 같은 거고, 두 조건을 모두 만족시키는 $\omega$들이 되다 보니 교집합이 되는 거죠.

결론

Random Variable의 정의에 대해 알아보았구요, 모든 Borel $\sigma$-field에서 확인할 필요 없이, 적당한 collection에서만 확인해 줘도 된다는 걸 알았습니다.

 

Random vector는 교집합과 연관이 깊을 수밖에 없다는 사실도 알게 되었습니다. 모든 조건을 충족하는 Outcomes를 찾아야 하니까요!

 

다음 포스팅은 Simple Approximation과 Random variable의 연산에 대해 알아보겠습니다.

 

Integration은 자세한 내용을 설명하기보다 확률론적 내용에 집중해서 설명하겠습니다~(몰라서 그런 거 아님. 진짜 아님.)

 

끗!