1. 코드보기
colab.research.google.com/drive/1qa8XsYNp_8FkJg8qRvvEmAkfzUrGNiy8?usp=sharing
[Programmer][Weak3] pandas.ipynb
Colaboratory notebook
colab.research.google.com
1. pandas 사용해보기
함수 | 설명 | 사용법 |
import pandas as 별명 | 판다스 불러오기 | import pandas as pd |
담을변수 = pd.Series(넣을 데이터셋) | 판다스시리얼 형식 데이터 만들기 | s = pd.Series([1,2,3,4]) |
print(시리얼 담은 변수 [불러올 데이터]) | 시리얼 데이터를 원하는 형식으로 불러올수 있다 | s[1:3] 범위 s[[1,3]] 요소만 s[s>s.median()] 중간보다 큰거 |
print(np.exp(시리얼)) | 넘피로 넣어서 보기도 가능 | np.exp(s) |
print(찾을 키 in 시리얼) t.get(찾을 키) |
딕셔너리 형태의 시리얼 값 찾는법 |
t = pd.Series({'one' : 1, 'two': 2, 'three' : 3 ,'four' : 4, 'five' : 5 }) t['six'] print('six' in t, 'seven' in t) t.get('seven') |
pd.Series(np.random.randn(5), name="random_nums") | 랜덤 만들어 보기 name이란 속성 변수가 있음 넣어줄 수 있다 | pd.Series(np.random.randn(5), name="random_nums") |
pd.read_csv(파일위치) | csv 불러올수 있다 | datacsv = pd.read_csv("./test.csv") |
시리얼.head(몇개) 시리얼.tail(5) |
csv 데이터를 위에서부터 아래서부터 가저온다 | datacsv.head(5) datacsv.tail(5) |
시리얼['조건'] | csv 열 조건에 속한거만 가져온다 | datacsv['Active'] datacsv['Active'][0] datacsv[data['Active']>1000] |
시리얼.unique() 시리얼[조건].unique() |
키값을 하나하나 가져온다 중복없엠 | datacsv['Active'].unique() |
pd.DataFrame(딕셔너리, index=[속성, 속성, 속성]) | 위에 csv처럼 만들어 준다 | books_dict = {"Available":[True, True, False], "Location":[102,215,323], "Genre":["Programming", "Physics","Math"]} books_df = pd.DataFrame(books_dict, index = ['버그란 무엇인가', '두근두근 고기학', '미쳐버린 홈즈']) books_df |
데이터프레임.loc[찾을거] 데이터프레임.loc[찾을거, 그안에 찾을거] |
속성의 정보를 찾아준다 | books_df.loc["버그란 무엇인가"] |
데이터프레임.iloc[0,1] 데이터프레임.iloc[1,0:2] |
데이터를 단위 혹은 원하는걸 숫자로 가져올수 있다 | books_df.iloc[0,1] books_df.iloc[1, 0:2] |
datacsv_by_region = datacsv["Active"].groupby(by=datacsv["WHO Region"] | 움 이건 그룹바이 하는것 무엇으로 묵어서 데이터를 만들어 놓음 안보임 | datacsv_by_region = datacsv["Active"].groupby(by=datacsv["WHO Region"] |
datacsv_by_region.sum() | 이데이터들을 묶을수 있는 방법을 넣어줌 예 다더하기 평균 높은수 등등 | datacsv_by_region.mean() |
datacsv['속성'][datacsv['속성'].idxmax()] | 제일큰 값을 찾아줌 .idxmax() 위치 숫자로 나옴 | datacsv['Acive'][datacsv['Deaths / 100 Cases'].idxmax()] |
datacsv[:][(covid["New cases"== 0]) & (covid["WHO Region"]=='Europe'] | & | 이걸로 and 나 or 만들어 줄수 있움 | datacsv[:][(covid["New cases"== 0]) & (covid["WHO Region"]=='Europe'] |
그리고 kaggle 데이터 가져오기
이건 코랩용
!pip install kaggle
!cp /content/drive/MyDrive/프로그래머스/kaggle/kaggle.json . #원래 파일 선택해 저장해줘야되는데 걍 드라이브에 저장된거 복사해옴
!mkdir -p ~/.kaggle
!mv kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json
!kaggle datasets download -d neuromusic/avocado-prices
!unzip avocado-prices.zip
!ls
이건 vs code 용
mv kaggle.json ~/.kaggle/
chmod 600 ~/.kaggle/kaggle.json
kaggle datasets download -d neuromusic/avocado-prices
unzip avocado-prices.zip
이렇게 해서 데이터도 api로 가져올수 있다
'Programmers > 데브코스 인공지능' 카테고리의 다른 글
[프로그래머스 스쿨 AI] 3weak 미션 (0) | 2021.05.07 |
---|---|
[프로그래머스 스쿨 AI] Weak 3 Matplotlib 사용하기 (0) | 2021.05.06 |
[프로그래머스 스쿨 AI] Weak 3 numpy (0) | 2021.05.04 |
[프로그래머스 스쿨 AI] Weak 3 깃 사용 (0) | 2021.05.03 |
[프로그래머스 스쿨 AI] Weak 3 엔트로피 (0) | 2021.05.03 |