본문 바로가기
완벽히 이해하는 수리통계학

1 확률이란? (feat. sample space, events)

by juhongyee 2024. 6. 25.
반응형

서론

이번 글은 수리통계학(2012,김우철) p11. 과 부록 1의 내용을 자세히 정리해보고자 합니다.

수리통계학을 한 번 훑으며 확률을 이해함에 확률함수 P(A)를 이해하는 것이 매우 중요하다는 생각이 들었습니다.

이를 제대로 알지 못하면 증명 중간중간 어려움을 겪게 되기에 오늘 확실히 이를 정리하겠습니다.

 

이번 주요 주제는 표본공간(sample space), 사건(events)입니다.

 

본 포스팅은 Statistical Inference(2rd, George Casella, Roger L. Berger) 및 수리통계학(2012, 김우철)의 내용을 해설합니다.

 

본론

확률에 대해 정의하려면 먼저 사건에 대해 정의할 필요가 있습니다. 사건이란 무엇일까요? 그냥 들었을 때는 매우 간단해보이지만 추상적으로 정의하려면 꽤나 어려움이 느껴집니다. 

 

김우철 수리통계학 부록에 적힌 말을 빌려 사건을 서술하자면 사건은 '확률을 정해줄 수 있는 표본공간의 부분집합'입니다.

여기서 표본공간(Sample space)은 무엇일까요?

정의 Sample space S (def 1.1.1 Casella-Berger)


The set, S, of all possible outcomes of a particular experiment is called the sample space for the experiment


Sample space란 우리가 실험을 통해 얻어낼 수 있는 모든 결과의 집합입니다. 예를 들어 [0,1]에서 randomly trial을 거쳐 실수를 뽑아본다고 해봅시다.(사실 우리가 무작위로 뽑는다, 실험(experiment) 등을 제대로 정의하지는 않았습니다. 직관적으로 봐주세요.)

그러면 그 나올 수 있는 경우는 0부터 1사이의 실수가 될 것입니다.

 

같지만 다른 sample space의 차이점

이 때 sample space는 [0,1]이 되겠죠? 만약 [1,1]에서 수를 뽑는데 [1,0)사이의 수가 나올 가능성이 없다고 해봅시다.  이 때는 sample space가 [1,1]이 될 것입니다. 서로 비슷해 보이지만 그 차이를 우리는 생각해 봅시다. sample space의 정의상 실험의 모든 경우를 포함해야 하기 때문에 0에서 -1 사이의 수가 나오는 경우가 [0,1]에서는 고려 자체가 안된 것이고 [1,1]에서는 고려가 된 것입니다.

 

그 차이는 확률에서 도드라지는데 [0,1]이 sample space인 경우에는 0부터 -1 사이의 수가 나오는 확률 자체가 정의되지 않지만 [1,1]이 sample space일 경우에는 그 확률이 0으로 정의됩니다. 왜냐면 sample space에 근본적으로 그 값이 존재하냐에 따라 확률을 정의할 것이기 때문이죠.

 

그러나 둘 다 sample space다.

두 집합 모두가 sample space가 될 수 있는 것은

mutually exclusive, collectively exhaustive, right granularity를 모두 만족하기 때문입니다.

 

각각은 간단히 말해 두 결과 동시에 일어나는 일이 존재하지 않고,(mutually exclusive)

모든 발생하는 사건을 집합이 커버한다는 의미입니다!(collectively exhaustive)

마지막으로, 실험과 관련이 없는 정보는 없다는 의미입니다.(나올 수 없는 결과 같은) (right granularity)

자세한 설명은 아래 링크로 남기겠습니다.

https://en.wikipedia.org/wiki/Sample_space

 

Sample space - Wikipedia

From Wikipedia, the free encyclopedia Set of all possible outcomes or results of a statistical trial or experiment In probability theory, the sample space (also called sample description space,[1] possibility space,[2] or outcome space[3]) of an experiment

en.wikipedia.org

 

정의 events(def 1.1.2 Casella-Berger)

이번에는 사건의 정의에 대해 알아보겠습니다.


An event is any collections of possible outcomes of an experiment, that is, any subset of S(including S itself)


사건이란 sample space의 부분집합입니다. 즉, 실험으로부터 일어날 수 있는 결과들의 부분집합이라는 거죠. 이는 즉 확률을 우리가 정의할 수 있게 됩니다. 

sample space가 일어날 수 있는 결과들의 집합이기 때문에, 위의  '확률을 정해줄 수 있는 표본공간의 부분집합' 라는 말을 이해할 수 있겠네요!

(하나 알아둬야할 것은! 일어날 수 없다 확률이 0이다.)

 

결론

표본 공간과 사건의 정의는 처음에 확실히 안 해두면 계속 헷갈리는 것 같아요.

이번에 표본공간과 사건의 정의에 대해 확실히 알아두었으니, 다음 글에서는 시그마 대수(sigma algebra)에 대해 알아보겠습니다.