1. 표본분포
표본을 얻기위핸 해석을 분석
하지만 전수조사(하나씩 다 새보는것) 과는 오차가 있다
실습 코드
colab.research.google.com/drive/14hpd3lJj4uPE062Mm1g9GBQXuWTkwScs?usp=sharing
[Programmer][Weak3] 표본분포.ipynb
Colaboratory notebook
colab.research.google.com
1. 단순 랜덤 추출법
난수 혹은 랜덤 넘버를 생성하여 사용한다
코드로는
import random
[random.randint(1,10) for i in range(10)]
2. 표본 평균의 분포
모수 = 표본조사를 통해 파악하고자 하는 정보
모수의 종류
모평균 = 모수들의 평균
모분산 = 모수들의 떨어진 정도
모비율 = 모수들의 비율
통계량 = 표번 평균이나 표본분사과 같은 표본의 특성값
2. 모본평균
모평균을 알아내는데 쓰이는 통계량
$x_1, x_2 , ... , x_n $
평균 = $\mu$
분산 = $\sigma ^2$
정규모집단에서 추출된 표본의 측정값
표본 평균
$\bar {x} = \frac{1}{n} \sum ^n _{i=1} x_i$
$\bar {x} ~ N (\mu , \frac{\sigma ^2}{n})$
즉 표본의 갯수(n) 가 많을 수록 확률분포는 낮아지는 것을 볼 수 있다
$\mu = 0, \sigma = 1, n = 10, Var(\bar X )= \frac{\sigma ^2}{n} =\frac{1}{10} $
파이썬 코드는 다음과 같다
import numpy as np
xbars = [np.mean(np.random.normal(size = 10))for i in range(10000)]
print("mean %f, var %f"%(np.mean(xbars), np.var(xbars)))
2. 중심극한 정리
$x_1, x_2 , ... , x_n $
평균 = $\mu$
분산 = $\sigma ^2$
정규모집단에서 추출된 표본의 측정값
표본 평균
$\bar {x} = \frac{1}{n} \sum ^n _{i=1} x_i$
$\bar {x} ~ N (\mu , \frac{\sigma ^2}{n})$
표본 평균 분산과 식이 같다
하지만 $n \geq 30 $ 조건이 붙는다
import numpy as np
import matplotlib as plt
n = 3
xbars = [np.mean(np.random.rand(n) * 10)for i in range(1000)]
print("mean %f, var %f"%(np.mean(xbars), np.var(xbars)))
h = plt.pyplot.hist(xbars, range= (0,10), bins =100)
중심 극한 정리
예제
import numpy as np
import matplotlib as plt
n = 2
xbars = [np.mean(np.random.exponential(scale=3, size=n))for i in range(10000)]
print("mean %f, var %f"%(np.mean(xbars), np.var(xbars)))
h = plt.pyplot.hist(xbars, range= (0,10), bins =100)
뭔가 치우쳐져 있다 저기의 scale 이 중앙 값이 되고
n의 숫자에 따라 모인 모양과 솔린 모양이 될 수 있다
'Programmers > 데브코스 인공지능' 카테고리의 다른 글
[프로그래머스 스쿨 AI] Weak 3 검정 (0) | 2021.05.03 |
---|---|
[프로그래머스 스쿨 AI] Weak 3 추정 (0) | 2021.05.03 |
[프로그래머스 스쿨 AI] Weak 2 몇가지 확률분포 (0) | 2021.05.02 |
[프로그래머스 스쿨 AI] Weak 2 확률 분포 (0) | 2021.05.02 |
[프로그래머스 스쿨 AI] Weak 2 확률 (0) | 2021.04.29 |