일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 서울데이터
- naver
- Python
- 도시공간분석
- 그래프이론
- SQL
- 그래프색상
- multinomiallogitregression
- connectivity
- spacesyntax
- platformurbanism
- 공간분석
- 도시설계
- digital geography
- graphtheory
- 네이버
- 공간데이터
- 웹크롤링
- 핫플레이스
- 베이지안
- 서울
- 베이지안뉴럴네트워크
- 도시인공지능
- pandas
- 스마트시티
- QGIS
- 파이썬
- digitalgeography
- 도시계획
- postgres
- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 서울데이터
- naver
- Python
- 도시공간분석
- 그래프이론
- SQL
- 그래프색상
- multinomiallogitregression
- connectivity
- spacesyntax
- platformurbanism
- 공간분석
- 도시설계
- digital geography
- graphtheory
- 네이버
- 공간데이터
- 웹크롤링
- 핫플레이스
- 베이지안
- 서울
- 베이지안뉴럴네트워크
- 도시인공지능
- pandas
- 스마트시티
- QGIS
- 파이썬
- digitalgeography
- 도시계획
- postgres
- Today
- Total
이언배 연구노트
[다양한 분포] 적재 적소에 분포 쓰기 본문
나는 아무리 봐도 연속확률분포들이 너무 헷갈린다.
Conjugate family 들끼리 정리가 한 번 필요하구나 싶다.
1-1. 이항 분포(Binomial Distribution) - n번 중에 몇 번 성공?
$$f(k; n, p) ={n \choose k}p^k (1-p)^{n-k}$$
성공확률 $p$, 성공횟수$k$
내가 좌판에서 핫도그 장사를 한다고 치자.
핫도그 살 확률이 40%인 사람 10명이 지나갈 때, 그 중 3명이 핫도그를 사간다면 k=3, p = 0.4
(참고:
- 기하분포 $f(x) = p(1-p)^{x-1}$ 는 첫 번째 성공까지의 시행 횟수, 즉 성공까지 몇 트?
- 음이항분포 $f(x) = {{x-1} \choose {r-1}}p^r(1-p)^{x-r}$ x는 r번째 성공까지의 시행 횟수, 즉 r번 성공까지 몇 트?)
1-2. 베타 분포(Beta Distribution) - 성공할 확률 몇 %?
$$f(x; \alpha, \beta) = \frac{\Gamma(\alpha + \beta}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1}$$
베타함수라고 $B(\alpha, \beta) = \int^{1}_{0}x^{\alpha-1}(1-x)^{\beta-1}dx$ 라는 게 이미 있는데,
여기서 $\Gamma$ 의 역할은 베타함수의 적분값이 1이 되도록 쓰는 normalization 이다.
$\alpha$랑 $\beta$가 각각 무슨 의미를 가지고 있는 것 같지는 않고,
모양을 결정하는 데 쓰인다고 생각하되
베타분포는 0~1사이 값이 뜰 확률(누적분포 함수로)을 주는 거라서 이항분포랑 짝지어지기 좋다.
내가 좌판에서 핫도그 장사를 한다고 치자.
사람들이 핫도그를 살 확률이 0.4인지, 0.5인지 그걸 계산할 수 있게 해주는 게 베타 분포이고,
$\alpha$와 $\beta$ 는 확률의 확률분포를 그려준다.
2-1. 푸아송 분포(Poisson Distribution) - 한 시간에 몇 번 가능?
$$f(k;\lambda) = \frac{\lambda^k e^{-\lambda}}{k!}$$
꼴이고, 기댓값과 분산이 모두 $\lambda$가 나오는 아름다운 모양이다.
$k$ 는 관심있는 사건의 발생 횟수, $\lambda$는 평균 발생률이다.
내가 좌판에서 핫도그 장사를 한다고 치자.
평균 한 시간에 10명이 사러 온다면, $\lambda = 10$ 으로 설정해서 15명이 사러올 확률도 계산할 수 있다.
2-2. 감마분포 (Gamma Distribution) - 몇 시간마다 몇 번 가능?
$$f(x; \alpha, \beta) = x^{\alpha-1} \frac{e^{-x / \beta}}{\beta^\alpha \Gamma(\alpha)}$$ for x>0
꼴이고, $\alpha(>0)$은 형상 모수, $\beta(>0)$ 은 척도 모수이다.
그러니까, $\alpha$ 는 모양을 결정하고, $\beta$ 는 얼마나 늘어지는지를 결정한다.
내가 좌판에서 핫도그 장사를 한다고 치자.
평균 10분마다 한 명이 핫도그를 사간다면, 척도모수 $\beta=10$ 이다.
두 명이 물건을 사는 간격을 모델링하려면 형상모수 $\alpha=2$로 둔다.
(참고: 지수분포 $f(x) = \lambda e^{-\lambda x}$ 는 몇 시간마다 한 번 가능?
이 때 한 명이 사가는 시간 간격을 잰다면 $\alpha=1$이 되고, 이건 지수분포(exponential distribution)과 똑같아진다. )
이 외에 conjugate distribution 은
prior: $N(\mu, \sigma^2), \sigma^2$ 알 때
posterior: $\mu \sim N(\mu_0, \tau_0^2$
prior: $N(\mu, \sigma^2$, $\mu$ 알 때, $\tau = 1/ \sigma^2$
posterior: $\tau \sim Gamma(a, b)$
prior: $Gamma(\alpha, \lambda), \alpha$ 알 때
posterior: $\lambda ~ Gamma(a, b)$
'Bayesian Analysis' 카테고리의 다른 글
[Bayesian Neural Network] 결과 분포의 분산과 Uncertainty의 관계 (0) | 2025.02.08 |
---|---|
[Bayesian Analysis] bayesian neural network 를 실전에 적용해보기 (0) | 2024.09.11 |
베이지안 계산 (1) | 2024.05.22 |
계층적 모형 (1) | 2024.05.21 |
베이지안 추론 (0) | 2024.05.21 |