Programmers/데브코스 인공지능

[프로그래머스 스쿨 AI] Weak 2 통계학

Or71nH 2021. 4. 29. 01:05

1. 용어

모집단 = 어떤질문이나 실험을 위해 관심의 대상이 되는 개체나 사건의 집합

 

예 전교 학생의 키

 

모수 = 모집단의 수치적인 특성

예 학생의 키의 평군

 

표본 - 모집단에서 선택된 개체나 사건의 집합

 

도수 = 어떤 사건이 실험이나 관찰로부터 발생한 횟수

 

표현방법

도수분포표 

막대그래프 : 하나씩 샌거

히스토그램 : 비슷한거 뭉탱이 지은거

 

양적 데이터 : 데이터가 세밀하게 되있어서 곂치는것이 거의 없음

 

모평균 $ \mu $

모집단 전체 자료일 경우

표본 평균 $\bar{ x }$

모집단에서 추출한 표본일 경우

 

분산

편차의 제곱의 합을 자료의 수로 나눈 값

편차 :값과 평균의 차이

 

자료가 모집단일 경우: 모분산

$\sigma ^2 = \frac{1}{N}\sum ^N _{i=1}(x_i- \mu )^2$
자료가 표본일 경우 표본분산

$s^2 = \frac{1}{n-1} \sum ^n_{i=1}(x_i - \bar x)^2$

 

표준 편차

분산의 양의 제곱근

모표준편차 (population standard deviation)

$\sigma = \sqrt{\frac{1}{N}\sum ^N _{i=1} (x_i - \mu)^2}$

표본표준편차 (smaple standard deviation)

$s = \sqrt{\frac{1}{n-1} \sum ^n_{i=1}(x_i - \bar x)^2}$

 

사분위수(Quartile)

Q1: 제1사분위수($1/4$)

자료를 정리하였을때 $1/4$  위치

Q3: 제3사분위수($3/4$)

자료를 정리하였을때 $3/4$  위치

 

z-score

어떤 값이 평균으로부터 몇 표준편차 떨어져 있는지를 의미하는 값

모집단의 경우

$ z = \frac{x- \mu}{\sigma}$

 

표본의 경우

$ z = \frac{x- \bar x}{s}$

 

2. 모듈 설치 및 실행

이제 실습을 위한 모듈 설치 난 컴터에 뭐 설치하는것을 별로 좋아하지 않아 

코랩을 사용하기로 하였다

colab.research.google.com/drive/1CG4q1clSuyu7NUUxMCDeHxnK6VfzemjQ?usp=sharing

 

[Programmer][Weak2] 통계학,기본개념

Colaboratory notebook

colab.research.google.com

이곳에서 코드를 보며 실행해볼수 있다

!sudo apt-get install python3-numpy python3-scipy python3-matplotlib python3-pandas python3-sympy python3-nose

이와같은 식으로 입력하여 모듈을 설치 할 수 있다

코랩은 터미널을 !를 이용하여 설치및 실행할 수 있다