Programmers/데브코스 인공지능

[프로그래머스 스쿨 AI] Weak 3 pandas

1. 코드보기

colab.research.google.com/drive/1qa8XsYNp_8FkJg8qRvvEmAkfzUrGNiy8?usp=sharing

 

[Programmer][Weak3] pandas.ipynb

Colaboratory notebook

colab.research.google.com

1.  pandas 사용해보기

함수 설명 사용법
import pandas as 별명 판다스 불러오기 import pandas as pd
담을변수 = pd.Series(넣을 데이터셋) 판다스시리얼 형식 데이터 만들기 s = pd.Series([1,2,3,4])
print(시리얼 담은 변수 [불러올 데이터]) 시리얼 데이터를 원하는 형식으로 불러올수 있다 s[1:3] 범위
s[[1,3]] 요소만
s[s>s.median()] 중간보다 큰거
print(np.exp(시리얼)) 넘피로 넣어서 보기도 가능 np.exp(s)

print(찾을 키 in 시리얼)

t.get(찾을 키)
딕셔너리 형태의 시리얼 값 찾는법

t = pd.Series({'one' : 1, 'two': 2, 'three' : 3 ,'four' : 4, 'five' : 5 })
t['six'] 
print('six' in t, 'seven' in t)
t.get('seven')
pd.Series(np.random.randn(5), name="random_nums") 랜덤 만들어 보기 name이란 속성 변수가 있음 넣어줄 수 있다 pd.Series(np.random.randn(5), name="random_nums")
pd.read_csv(파일위치) csv 불러올수 있다 datacsv = pd.read_csv("./test.csv")
시리얼.head(몇개)
시리얼.tail(5)
csv 데이터를 위에서부터 아래서부터 가저온다 datacsv.head(5)
datacsv.tail(5)
시리얼['조건'] csv 열 조건에 속한거만 가져온다 datacsv['Active']
datacsv['Active'][0]
datacsv[data['Active']>1000]
시리얼.unique()
시리얼[조건].unique()
키값을 하나하나 가져온다 중복없엠 datacsv['Active'].unique()
pd.DataFrame(딕셔너리, index=[속성, 속성, 속성]) 위에 csv처럼 만들어 준다 books_dict = {"Available":[True, True, False], "Location":[102,215,323], "Genre":["Programming", "Physics","Math"]}
books_df = pd.DataFrame(books_dict, index = ['버그란 무엇인가', '두근두근 고기학', '미쳐버린 홈즈'])
books_df
데이터프레임.loc[찾을거]
데이터프레임.loc[찾을거, 그안에 찾을거]
속성의 정보를 찾아준다 books_df.loc["버그란 무엇인가"]
데이터프레임.iloc[0,1]
데이터프레임.iloc[1,0:2]
데이터를 단위 혹은 원하는걸 숫자로 가져올수 있다 books_df.iloc[0,1]
books_df.iloc[1, 0:2]
datacsv_by_region = datacsv["Active"].groupby(by=datacsv["WHO Region"] 움 이건 그룹바이 하는것 무엇으로 묵어서 데이터를 만들어 놓음 안보임 datacsv_by_region = datacsv["Active"].groupby(by=datacsv["WHO Region"]
datacsv_by_region.sum() 이데이터들을 묶을수 있는 방법을 넣어줌 예 다더하기 평균 높은수 등등  datacsv_by_region.mean()
datacsv['속성'][datacsv['속성'].idxmax()] 제일큰 값을 찾아줌 .idxmax() 위치 숫자로 나옴 datacsv['Acive'][datacsv['Deaths / 100 Cases'].idxmax()]
datacsv[:][(covid["New cases"== 0]) & (covid["WHO Region"]=='Europe'] & | 이걸로 and 나 or 만들어 줄수 있움 datacsv[:][(covid["New cases"== 0]) & (covid["WHO Region"]=='Europe']

그리고 kaggle 데이터 가져오기

이건 코랩용 

!pip install kaggle
!cp /content/drive/MyDrive/프로그래머스/kaggle/kaggle.json . #원래 파일 선택해 저장해줘야되는데 걍 드라이브에 저장된거 복사해옴
!mkdir -p ~/.kaggle
!mv kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json
!kaggle datasets download -d neuromusic/avocado-prices
!unzip avocado-prices.zip
!ls

이건 vs code 용

mv kaggle.json ~/.kaggle/
chmod 600 ~/.kaggle/kaggle.json
kaggle datasets download -d neuromusic/avocado-prices
unzip avocado-prices.zip

이렇게 해서 데이터도 api로 가져올수 있다