베이지안 추론

« 2025/03 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Tags more

Archives

Today

Total

« 2025/03 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Tags more

Archives

Today

Total

관리 메뉴

이언배 연구노트

베이지안 추론 본문

Bayesian Analysis

베이지안 추론

이언배 2024. 5. 21. 13:48

1. 점추정

보통 사후평균(posterior mean 사후분포의 평균), 사후중앙값(posterior median 비대칭사후분포에서 많이 쓰임), 사후최빈값(posterior mode 우도함수$p(\theta | y)$를 최대화하는, 그러니까 "지금 나온 y들을 잘 내놓음직한")가 있다.

사후평균은 $E(\theta | y)$, 즉 사후확률의 기댓값을 구하는 거고,

추정의 정확도인 사후평균제곱오차 $V_\delta (y) = E\left[(\delta(y) - \theta)^2 | y \right]$ 를 사용. 추정값과 $\theta$ 의 차이가 가지는 기댓값

다변량의 경우에는 보통 MAP(사후최빈값) 를 많이 씀.

2. 신용구간

○ 프리퀀시스트들의 신뢰구간(confidence interval) 95%: 여러번 반복해서 표본을 추출하면 95% 구간 내에는 반드시 모수를 포함함

○ 베이지안의 신용구간(credible interval) 95%: 모수를 포함하는 확률이 높은 구간.

사후분포 $p(\theta|y_1, ..., y_n)$이 주어졌을 때 신용구간 찾는 법

(a) $p(\theta | y_1, ..., y_n)=k$를 만족하는 모든 해를 찾는 서브루틴을 만듦. 여기서 $\theta_1(k) < \theta_2(k)$ 인 두 해를 찾았다고 치자

(b) $C_k = \left[\theta_1(k), \theta_2(k) \right]$ 라는, $\theta_1(k) ~ \theta_2(k)$ 까지의 구간을 가정하고

$p(\theta \in C(k) | y_1, ..., y_n) = \int_{\theta_1(k)}^{\theta_2(k)}p(\theta | y_1, ..., y_n) d\theta$ 를 구함, 그러니까 저 구간 안에 있는 모든 $\theta$ 후보군들이 $y1, ..., y_n$ 에서 나올 확률을 계산

3. 가설검정

○ 프리퀀시스트의 가설검정: $H_0: \theta \in \mathit{\Theta}_0$, $H_1: \theta \in \mathit{\Theta}_1$ 에 대한 오류의 확률에 근거

○ 베이지안의 가설검정: $H_0$의 사후확률 $\alpha_0 = P(\theta \in \mathit{\Theta}_0 | y$ 와 $H_1$의 사후확률 $\alpha_1 = P(\theta \in \mathit{\Theta}_1 | y$ 의 각각 확률을 구해서 큰 거를 고르면 됨.

가설 $H_0$를 지지하는 베이즈 인자(Bayes factor; BF) 의 식은

$BF = \frac{\alpha_0 / \alpha1}{\pi _ 0 / \pi _ 1}$ = \frac{\alpha_0 / \pi_0}{\alpha_1 / \pi_1}$, 즉

가설 $H_1$에 대한 가설 $H_1$ 의 사후 오즈(posterior odds) / 가설 $H_1$에 대한 가설 $H_1$ 의 사전 오즈(prior odds) 와 같다.

쉽게 봐서, $H_0: \theta = \theta_0$ 랑 $H_1: \theta = \theta_1$ 이랑 비교한다고 치자.

각각 사후확률은 베이즈 정리에 의해

$$\alpha_0 = \pi_0 p(y | \theta_0) / \left[\pi_0 p(y|\theta_0) + \pi_1 p(y|\theta_1) \right]$$

$$\alpha_1 = \pi_1 p(y | \theta_1) / \left[\pi_0 p(y|\theta_0) + \pi_1 p(y|\theta_1) \right]$$

그럼 $H_1$에 대한 $H_0$의 사후 오즈는 $\frac{\alpha_0}{\alpha_1} = \frac{\pi_0 p(y|\theta_0)}{\pi_1 p(y|\theta_1)}$

그럼 $H_0$ 의 베이즈인자 $BF = \frac{\alpha_0 \pi1}{\alpha1 \pi_0}$ = \frac{p(y|\theta_0}{p(y|\theta_1)}

결국 우도비(likelihood ratio) 임.

그냥 $H_0$ 이랑 $H_1$의 확률 비율이고, 이 비율이 크면 (BF>15) 아주 강한 증거, 12~150사이면 강한증거, 3~12면 긍정적 증거, 1~3이면 약한 증거, <1이면 H1을 지지하는 거다.

728x90

'Bayesian Analysis' 카테고리의 다른 글

베이지안 계산 (1)	2024.05.22
계층적 모형 (1)	2024.05.21
사전분포의 선택 (0)	2024.05.20
우도함수(Likelihood) 와 베이지안 패러다임 (0)	2024.05.20
조건부 확률 기초 정리 (0)	2024.05.20

'Bayesian Analysis' Related Articles

이언배 연구노트

베이지안 추론 본문

베이지안 추론

1. 점추정

2. 신용구간

3. 가설검정

'Bayesian Analysis' 카테고리의 다른 글

티스토리툴바