통계학

bayesian 통계학

주녕콩 2024. 3. 19. 02:14

베이지안 이론 

1. 빈도 확률(Frequentist probability) vs 베이지안 확률(Bayesian probability)

 

-빈도 확률(Frequentist probability)

 

대표적으로  빈도확률을 많은 사람들이 알고 있습니다. 

 

동전 던지기, 주사위 던지기 정도를 대표적인 예시로 나타낼 수 있을 것 같습니다.

 

동전을 10번 던졌을때 앞면이 4번 나왔다고 말하면 4/10이라고 나타 낼 수 있습니다.

이걸 계속 반복하면 100번 던졌을 경우 9/20이라고 나타 낼 수 있을것 입니다. 이렇게 반복하여 빈도수를 측정하게 되면 많은 사람들이 아는 빈도확률을 구할 수 있습니다.

 

-베이지안 확률(Bayesian probability)

 

베이지안 확률은 빈도확률로는 구할 수 없는 영역까지 구할 수 있게 도와줄 수 있습니다. 

 

예를 들어 대통령 선거, 화산 폭팔 정도를 예를 들 수 있을 것 같습니다.

 

이 경우는 빈도로 구하기에는 많은 문제를 가지게 됩니다. 문제로는 반복으로는 신뢰를 가지기 어렵다는 점이 있습니다.

 

베이지안 예를 들어 대통령 선거를 예로 들면 ..여론, 출신 등의 영향을 가지게 되는 방안까지 계산을 하여 선거 확률을 구하게 되는 방식 정도로 이해 할 수 있을 것 같습니다.

 

일어나지 않은 일에 대한 확률을 불확실성의 개념. 즉, 사건과 관련 있는 어려 확률을 이용해 새롭게 일어날 사건을 추정하는 것이 베이지안 확률입니다.

 

 

2. 베이지안 확률(Bayesian probability) 정의

 

-베이즈정리 (Bayes’ theorem)라 불리며, 종속적(의존적) 관계에 놓인 사건들을 기반으로 확률을 구합니다.

-두 확률 변수의 사전 확률과 사후 확률 사이의 관계를 나타내는 정리합니다.

-사전확률 P(A)과 우도확률 P(B|A)를 안다면 사후확률 P(A|B)를 알 수 있게 됩니다.

-베이지안 확률은 아래 조건부 확률로 나타내며, 정보를 업데이트하면서 사후확률 P(A|B)를 구하는 것입니다.

 

P(H), 사전확률(prior probability) : 결과가 나타나기 전에 결정되어 있는 A(원인)의 확률.
P(D|H), 우도확률(likelihood probability) : A(원인)가 발생하였다는 조건하에서 B(결과)가 발생할 확률.
P(H|D), 사후확률(posterior probability) : B(결과)가 발생하였다는 조건하에서 A(원인)가 발생하였을 확률.

 

3. 베이지안 확률(Bayesian probability) 계산식

 

-위의 정의가 나오는 계산식 과정입니다.

-P(B) 값은 A와 A 여집합과 P(B) 사이의 교집합 합으로 구할 수 있습니다.