작성일자 : 2023-09-24
Ver 0.1.1
CSV 파일(.csv) 불러오기 및 저장하기
불러오기
import pandas as pd
data = pd.read_csv("path/filename.csv" [, options])
매개변수
- filepath or buffer
- 파일경로/파일이름.csv 을 입력하여 파일을 불러온다
- sep or delimiter
- 초기값은 comma(,)
- 만일 분리되어있는 기준이 쉼표(,)로 분리되어 있지 않은 경우 기준이 되는 값을 입력하면 된다. 예를 들어 슬라이스(/), Tab( ) 등 으로 분리되어 있는 경우를 말한다
- header
- 초기값은 0
- 컬럼명으로 사용할 행의 번호를 입력한다.
- names
- 사용할 변수명을 입력합니다. 파일에 변수명이 없다면 header를 None으로 설정해야한다.
- index_col
- 데이터의 인덱스로 사용할 열의 번호를 입력한다.
- skiprows
- 첫 행을 기준으로 데이터를 얼마나 건너뛰고 읽어올지를 정한다.
- nrows
- 파일을 읽어올 행의 수를 입력한다.
- date_parser
- 시계열 타입으로 변환할 변수를 입력한다.
저장하기
data.to_csv("path/filename.csv", index = False)
단, 여기서 data는 위에서 read_csv를 통해 불러온 data와 같이 pandasdml DataFrame 형식이거나 Series 형식이어야 한다.
Index는 data의 index(행의 이름) 저장 여부를 결정하는 옵션이다. index가 False라면 index를 저장하지 않는다.
엑셀 파일(.xlsx) 읽기 및 저장하기
불러오기
import pandas as pd
data = pd.read_excel("path/filename.xlsx" [, options])
저장하기
Excel 에는 csv와는 달리 sheet가 존재한다. ExcelWriter를 활용하면 sheet에 각각 data를 export할 수 있다.
writer = pd.ExcelWriter("test_excel.xlxs")
data1.to_excel(writer, sheet_name = '1번 sheet')
data2.to_excel(writer, sheet_name = '2번 sheet')
writer.save()
Jason 파일(.jason) 읽기 및 저장하기
불러오기
import pandas as pd
data = pd.read_json("path/filename.json")