작성일자 : 2023-09-24 Ver 0.1.1 Pandasql 소개 Pandasql은 파이썬에서 인기 있는 데이터 조작 라이브러리인 Pandas에 대한 SQL 인터페이스를 제공하는 파이썬 라이브러리다. 이를 통해 SQL에 익숙한 사용자에게는 직관적이고 효율적인 방법으로 데이터를 조작하고 분석할 수 있다. Pandasql은 SQLite 구문을 기반으로 하며, 데이터베이스 작업 시 익숙한 모든 SQL 문을 사용할 수 있도록 지원한다. 데이터 클리닝 작업이나 복잡한 데이터 분석 작업을 수행하더라도, Pandasql을 사용하면 프로세스를 더 간소화하고 효율적으로 수행할 수 있다. #pandasql 설치 !pip install pandasql #pandas 실행 import pandas as pd #panda..
pandas
작성일자 : 2023-09-24 Ver 0.1.1 CSV 파일(.csv) 불러오기 및 저장하기 불러오기 import pandas as pd data = pd.read_csv("path/filename.csv" [, options]) 매개변수 filepath or buffer 파일경로/파일이름.csv 을 입력하여 파일을 불러온다 sep or delimiter 초기값은 comma(,) 만일 분리되어있는 기준이 쉼표(,)로 분리되어 있지 않은 경우 기준이 되는 값을 입력하면 된다. 예를 들어 슬라이스(/), Tab( ) 등 으로 분리되어 있는 경우를 말한다 header 초기값은 0 컬럼명으로 사용할 행의 번호를 입력한다. names 사용할 변수명을 입력합니다. 파일에 변수명이 없다면 header를 None으로..
작성일자 : 2023-08-23 Ver 0.1.1 DataFrame Pandas의 Series가 1차원 형태의 자료구조라면 DataFrame은 여러 개의 열로 구성된 2차원 형태의 자료구조임 numpy array를 받아 만들 수 있으며, Series 처럼 변환 가능한 오브젝트들을 갖고 있는 dict 형태를 인자로 넣어주어 DataFrame을 만들 수 있음 ex = pd.DataFrame({'A': 1., 'B': pd.Timestamp('20130102'), 'C': pd.Series(1, index=list(range(5)), dtype='float32'), 'D': np.array(np.arange(3,8,1), dtype='int32'), 'E': pd.Categorical(['test', 'tra..
작성일자 : 2023-08-28 수정일자 : 2023-10-02 Ver 0.1.2 0. Pandas Pandas 는 정형 데이터 분석을 위한 자료구조로 데이터 분석 도구를 제공하는 파이썬 라이브러리이며, Pandas 의 특징은 다음과 같음 각각의 행,열에 따라 데이터를 정렬할 수 있는 자료구조 시계열, 비시계열 데이터를 함께 다룰 수 있는 통합 자료구조 데이터의 결측치값을 유연하게 처리할 수 있는 기능 데이터 핸들링 및 특정 행,열의 모든 값을 더하는 등의 데이터 연산 기능 Numpy (numeric python)을 바탕으로 Excel / SQL / JSON / HTML / CSV와 같은 정형 데이터를 처리하기위해 개발된 2008년에 개발된 *라이브러리 *라이브러리 : 특정 목적을 수행하는 함수들의 집합..