본문 바로가기
카테고리 없음

[전처리] python 데이터 추출 (기본)

by 인디코더 2020. 2. 13.

사용 Tool : jupyter notebook

0. 라이브러리 임포트

import pandas as pd  # pandas 데이터 프레임 라이브러리 가지고옴
import numpy as np

1. 데이터 추출하기 

(경로를 모를때는 pwd로 현재 경로를 볼 수 있다.)
reserve_tb = pd.read_csv('data/reserve.csv', encoding = 'utf-8') # 인코딩 설정.
reserve_tb.head() # reserve_tb가 잘 들어왔는지 5 행말 추출한다.
reserve_tb.shape # reserve_tb의 행과 열의 수를 볼 수 있다. 전체적인 shape 확인 가능
                      # numpy함수의 기능
# head(N) : 상위에서 추출할 숫자를 설정할 수 잇다.

2. 추출할 열 설정하기

# dataframe은 행과 열을 이해하고 잘 다루는 능력이 필요하다고 생각됨.

reserve_tb[['reserve_id','hotel_id','customer_id','reserve_datetime']]

3. 열 제거 

# drop 한수로 불필요한 열을 제거함. 
# axis를 1로 하여 열제거를 지정함.  
# inplace를 true로 하여 reserve_tb를 갱신함.  제거 된것을 적용시킴
reserve_tb.drop(['people_num','total_price'], axis=1 , inplace =True)

반응형