이언배 연구노트

[다양한 분포] 적재 적소에 분포 쓰기 본문

Bayesian Analysis

[다양한 분포] 적재 적소에 분포 쓰기

이언배 2024. 5. 22. 15:22

나는 아무리 봐도 연속확률분포들이 너무 헷갈린다.

Conjugate family 들끼리 정리가 한 번 필요하구나 싶다.

 

1-1. 이항 분포(Binomial Distribution) - n번 중에 몇 번 성공?

$$f(k; n, p) ={n \choose k}p^k (1-p)^{n-k}$$ 

성공확률 $p$, 성공횟수$k$

 

내가 좌판에서 핫도그 장사를 한다고 치자.

핫도그 살 확률이 40%인 사람  10명이 지나갈 때,  그 중 3명이 핫도그를 사간다면 k=3, p = 0.4


(참고:

- 기하분포 $f(x) = p(1-p)^{x-1}$ 는 첫 번째 성공까지의 시행 횟수, 즉 성공까지 몇 트?

- 음이항분포 $f(x) = {{x-1} \choose {r-1}}p^r(1-p)^{x-r}$ x는 r번째 성공까지의 시행 횟수, 즉 r번 성공까지 몇 트?)

1-2. 베타 분포(Beta Distribution) - 성공할 확률 몇 %?

$$f(x; \alpha, \beta) = \frac{\Gamma(\alpha + \beta}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1}$$

베타함수라고 $B(\alpha, \beta) = \int^{1}_{0}x^{\alpha-1}(1-x)^{\beta-1}dx$ 라는 게 이미 있는데,

여기서 $\Gamma$ 의 역할은 베타함수의 적분값이 1이 되도록 쓰는 normalization 이다.

 

$\alpha$랑 $\beta$가 각각 무슨 의미를 가지고 있는 것 같지는 않고,

모양을 결정하는 데 쓰인다고 생각하되

베타분포는 0~1사이 값이 뜰 확률(누적분포 함수로)을 주는 거라서 이항분포랑 짝지어지기 좋다.

 

내가 좌판에서 핫도그 장사를 한다고 치자.

사람들이 핫도그를 살 확률이 0.4인지, 0.5인지 그걸 계산할 수 있게 해주는 게 베타 분포이고,

$\alpha$와 $\beta$ 는 확률의 확률분포를 그려준다.

 

 

2-1. 푸아송 분포(Poisson Distribution) - 한 시간에 몇 번 가능?

$$f(k;\lambda) = \frac{\lambda^k e^{-\lambda}}{k!}$$

꼴이고, 기댓값과 분산이 모두 $\lambda$가 나오는 아름다운 모양이다.

$k$ 는 관심있는 사건의 발생 횟수, $\lambda$는 평균 발생률이다.

 

내가 좌판에서 핫도그 장사를 한다고 치자.

평균 한 시간에 10명이 사러 온다면, $\lambda = 10$ 으로 설정해서 15명이 사러올 확률도 계산할 수 있다.

 

2-2. 감마분포 (Gamma Distribution) - 몇 시간마다 몇 번 가능?

$$f(x; \alpha, \beta) = x^{\alpha-1} \frac{e^{-x / \beta}}{\beta^\alpha \Gamma(\alpha)}$$ for x>0

 

꼴이고, $\alpha(>0)$은 형상 모수, $\beta(>0)$ 은 척도 모수이다.

그러니까, $\alpha$ 는 모양을 결정하고, $\beta$ 는 얼마나 늘어지는지를 결정한다.

$k = \alpha$, $\theta = \beta$

내가 좌판에서 핫도그 장사를 한다고 치자.

평균 10분마다 한 명이 핫도그를 사간다면, 척도모수 $\beta=10$  이다.

두 명이 물건을 사는 간격을 모델링하려면 형상모수 $\alpha=2$로 둔다.

 

(참고: 지수분포 $f(x) = \lambda e^{-\lambda x}$ 는 몇 시간마다 한 번 가능?

이 때 한 명이 사가는 시간 간격을 잰다면 $\alpha=1$이 되고, 이건 지수분포(exponential distribution)과 똑같아진다. )

 

 

이 외에 conjugate distribution 은

prior: $N(\mu, \sigma^2), \sigma^2$ 알 때

posterior: $\mu \sim N(\mu_0, \tau_0^2$

 

prior: $N(\mu, \sigma^2$, $\mu$ 알 때, $\tau = 1/ \sigma^2$

posterior: $\tau \sim Gamma(a, b)$

 

prior: $Gamma(\alpha, \lambda), \alpha$ 알 때

posterior: $\lambda ~ Gamma(a, b)$

728x90