1. 이항분포
이름 | 설명 | 부르는 방법 |
베르누이 시행 | 적확하게 2개의 결과만 가지는 실험 |
성공확률 : $p$ |
확률 변수 X | $n$번의 베르누이 시행에서 성공의 횟수 | 이항확률 변수라고 함 |
이항분포 |
이항확률변수의 확률 분포 |
이항분포 |
이항확률변수 X의 확률 분포
$f(x) = p[X=x]= \binom{n}{x}p^x(1-p)^{n-x}$
이항확률변수 X의 확률 분포
$f(x) = p[X=x]= \binom{n}{x}p^x(1-p)^{n-x}$
예) 랜덤박스 뽑기 S급 득탬할 확률은 0.2 나머지는 꽝
3개를 뽑았을때 적어도 하나이상의 S 카드가 나올 확률은?
$P[X\geq 1]= 1 - P[X = 0] = 1 - \binom{3}{0}(0.2)^0(1-0.2)^{3-0} = 1- 0.512 = 0.488$
코드로 구연하기
from scipy import stats
1 - stats.binom.cdf(0, n=3, p=0.2)
평균 = E(X) = np
분산 = Var(x) = np(1-p)
표준편차 SD(X) = $\sqrt{np(1-p)}$
stats.binom.stats(n=3, p=0.2)
실제 코드를 실행해 볼 수 있게 만들어 놨다
Google Colaboratory Notebook
Run, share, and edit Python notebooks
colab.research.google.com
2. 정규분포
1. 연속확률 변수의 확률 분포
확률 밀도함수 (probabo;oty density function) = $f(x)$
[근데 $f(x)$는 중복되는게 많은건가 다 f(x)라고 하는거같은데?]
$P[a \leq X \leq b ]= \int ^b_a f(x) dx$
그래프 아래 부분의 넓이가 확률이 된다고 한다 하지만
내눈에는 그냥 어디부터 어디까지의 갯수 더한거로 보인다
2. 정규뷴포의 확률 밀도함수
$f(x) = \frac{1}{\sqrt{2\pi }\sigma}e^{-\frac{1}{2} (\frac{x-\mu }{\sigma })^2}$
$\mu$ 에서 제일 크다
X ~ (따른다) N(평균$\mu$, 분산$\sigma$#)
그런 뜻이라고 한다
표준정규확률변수
$Z = \frac{X-\mu}{\sigma}$
표준 정규분포
Z~N(0,1)
표준 정규 분포표
$P[Z \leq z]$
이런게 있다
예제
$X ~ N(4,3^2)$
$P[X \leq 4] = ?$
$= P[\frac{X-\mu}{\sigma} \leq \frac{4-\mu}{\sigma}] = P[Z \leq \frac{4-4}{3}]=P[Z \leq 0] $
$= 0.5$
stats.norm.cdf(4,4,scale = 3)
$P[4 \leq X \leq 7] = ?$
$P[\leq 7]-P[X < 4] = P[Z \leq \frac{7-4}{3} -P[Z<0] $
$= P[Z \leq 1] - P[Z < 0 ] = 0.8413 - 0.5 = 0.3413 $
stats.norm.cdf(7, loc=4, scale=3)- stats.norm.cdf(4,loc=4,scale=3)
3. 포아송 분포(Poisson distribution)
일정한 시간단위 또는 공간 단위에서 발생하는 이벤트의 수의 확률 분포
확률분포함수 (확률질량함수)
$P[X = x] = f(x) = \lambda ^x \frac{e^{-\lambda}}{x!},x = 0.1.2....$
평균 = $ \lambda $
분산 = $ \lambda $
예제) 1.평균이 3 이고 시간당 접속자수는
2.앞으로 1시간동안 접속자수가 2명 이하일 확률
$P[X \leq 2] = P[X =0]+P[X = 1]+P[X = 2]= 3^0 \frac{e^{-3}}{0!} +3^1 \frac{e^{-3}}{1!}+3^2 \frac{e^{-3}}{2!}$
$= 0.4998 + 0.14936 + 0.22404 = 0.42319$
stats.poisson.cdf(2, mu = 3)
여기 위에 mu 가 lamda 이다 햇갈릴수 있다!
4. 지수분포(exponential distribution)
포아송 분포에 의해 어떤 사건이 발생할 때, 어느 한시점으로 부터 이사건이 발생할 때까지 걸리는 시간에 대한 확률 분포
확률밀도 함수
$f(t) = \lambda e ^{-\lambda t}
$\lambda $ = 포아송분포의 평균
평균
$E(T) = \frac {1}{\lanbda}$
분산
Var(T) = \frac{1}{\lambda ^2}
예제 ) 어느 웹사이트에 시간당 접속자 수는 $\lambda = 3 $의 포아송 분포를 따른다고 한다.
지금부터 시작하여 첫번째 접속자가 30분 이내에 올 확률은?
$P[T \leq 0.5] = \int ^{0.5}_{0} \lambda e^{-\lambda t}dt = \int ^{0.5}_{0} 3e^{-3t}dt = [-e^{-3t}]^{0.5}_{0} = 1 - e^{-1.5} = 1 - 0.2231 =$
뭔가 핵심을 공부해야하는데 핵심이 뭔지 빗겨가면서 못 외우는거 같다 음...
'Programmers > 데브코스 인공지능' 카테고리의 다른 글
[프로그래머스 스쿨 AI] Weak 3 추정 (0) | 2021.05.03 |
---|---|
[프로그래머스 스쿨 AI] Weak 3 표본분포 (0) | 2021.05.03 |
[프로그래머스 스쿨 AI] Weak 2 확률 분포 (0) | 2021.05.02 |
[프로그래머스 스쿨 AI] Weak 2 확률 (0) | 2021.04.29 |
[프로그래머스 스쿨 AI] Weak 2 통계학 (0) | 2021.04.29 |