Programmers/데브코스 인공지능

[프로그래머스 스쿨 AI] Weak 3 표본분포

1. 표본분포 

표본을 얻기위핸 해석을 분석 

하지만 전수조사(하나씩 다 새보는것) 과는 오차가 있다

 

실습 코드
colab.research.google.com/drive/14hpd3lJj4uPE062Mm1g9GBQXuWTkwScs?usp=sharing

 

[Programmer][Weak3] 표본분포.ipynb

Colaboratory notebook

colab.research.google.com

1. 단순 랜덤 추출법

난수 혹은 랜덤 넘버를 생성하여 사용한다

코드로는 

import random
[random.randint(1,10) for i in range(10)]

 

2. 표본 평균의 분포

모수 =  표본조사를 통해 파악하고자 하는 정보

 

모수의 종류

모평균 = 모수들의 평균 

모분산 = 모수들의 떨어진 정도

모비율 = 모수들의 비율

통계량 = 표번 평균이나 표본분사과 같은 표본의 특성값

2. 모본평균

모평균을 알아내는데 쓰이는 통계량

 

$x_1, x_2 , ... , x_n $

평균 = $\mu$

분산 = $\sigma ^2$

정규모집단에서 추출된 표본의 측정값

 

표본 평균

$\bar {x} = \frac{1}{n} \sum ^n _{i=1} x_i$

$\bar {x} ~ N (\mu , \frac{\sigma ^2}{n})$

 

즉 표본의 갯수(n) 가 많을 수록 확률분포는 낮아지는 것을 볼 수 있다

 

$\mu = 0, \sigma = 1, n = 10, Var(\bar X )= \frac{\sigma ^2}{n} =\frac{1}{10} $

파이썬 코드는 다음과 같다

import numpy as np
xbars = [np.mean(np.random.normal(size = 10))for i in range(10000)]
print("mean %f, var %f"%(np.mean(xbars), np.var(xbars)))

2. 중심극한 정리

$x_1, x_2 , ... , x_n $

평균 = $\mu$

분산 = $\sigma ^2$

정규모집단에서 추출된 표본의 측정값

 

표본 평균

$\bar {x} = \frac{1}{n} \sum ^n _{i=1} x_i$

$\bar {x} ~ N (\mu , \frac{\sigma ^2}{n})$

 

표본 평균 분산과 식이 같다 

하지만 $n \geq 30 $ 조건이 붙는다

 

import numpy as np
import matplotlib as plt

n = 3
xbars = [np.mean(np.random.rand(n) * 10)for i in range(1000)]
print("mean %f, var %f"%(np.mean(xbars), np.var(xbars)))
h = plt.pyplot.hist(xbars, range= (0,10), bins =100)

중심 극한 정리

예제

import numpy as np
import matplotlib as plt

n = 2
xbars = [np.mean(np.random.exponential(scale=3, size=n))for i in range(10000)]
print("mean %f, var %f"%(np.mean(xbars), np.var(xbars)))
h = plt.pyplot.hist(xbars, range= (0,10), bins =100)

뭔가 치우쳐져 있다 저기의 scale 이 중앙 값이 되고

n의 숫자에 따라 모인 모양과 솔린 모양이 될 수 있다