작성일자 : 2023-08-23 Ver 0.1.1 DataFrame Pandas의 Series가 1차원 형태의 자료구조라면 DataFrame은 여러 개의 열로 구성된 2차원 형태의 자료구조임 numpy array를 받아 만들 수 있으며, Series 처럼 변환 가능한 오브젝트들을 갖고 있는 dict 형태를 인자로 넣어주어 DataFrame을 만들 수 있음 ex = pd.DataFrame({'A': 1., 'B': pd.Timestamp('20130102'), 'C': pd.Series(1, index=list(range(5)), dtype='float32'), 'D': np.array(np.arange(3,8,1), dtype='int32'), 'E': pd.Categorical(['test', 'tra..
Python
작성일자 : 2023-08-28 수정일자 : 2023-10-02 Ver 0.1.2 0. Pandas Pandas 는 정형 데이터 분석을 위한 자료구조로 데이터 분석 도구를 제공하는 파이썬 라이브러리이며, Pandas 의 특징은 다음과 같음 각각의 행,열에 따라 데이터를 정렬할 수 있는 자료구조 시계열, 비시계열 데이터를 함께 다룰 수 있는 통합 자료구조 데이터의 결측치값을 유연하게 처리할 수 있는 기능 데이터 핸들링 및 특정 행,열의 모든 값을 더하는 등의 데이터 연산 기능 Numpy (numeric python)을 바탕으로 Excel / SQL / JSON / HTML / CSV와 같은 정형 데이터를 처리하기위해 개발된 2008년에 개발된 *라이브러리 *라이브러리 : 특정 목적을 수행하는 함수들의 집합..
작성일자 : 2023-08-28 Ver 0.1.1 1. Numpy란? Numerical python의 줄임말로써 고성능의 수치 계산을 하기 위해 만들어진 파이썬 package Numpy는 과학 계산을 위한 수치해석용 라이브러리로서 다차원 배열을 처리하는데 필요한 여러 유용한 기능을 제공하고 있음 기본적으로 array라는 자료 구조를 제공하며 선형대수용 행렬, 벡터 수학 계산을 위한 자료구조와 계산 함수를 제공 보통 과학용 일반 함수 목록으로 SciPy, 차트용 라이브러리인 Matplotlib, 고수준 DataFrame 제공 모듈인 Pandas와 함께 사용 1.1 Numpy 특징 특징, 메트릭스, 고수준의 배열은 과학계산 컴퓨팅에 있어 필수 도구라 할 수 있음 입력 값 세트를 통해 계산이 반복될 때, 배열..
작성일자 : 2023-07-25 Ver 0.1.1 1. Jupyter Notebook Syntax Notebook은 셀(cell)이라는 네모 칸들로 구성된 Notebook을 새로 만들면 하나의 셀만 표시되어 있음 단축키 b를 누르면 같은 결과를 얻을 수 있으며, a를 누르면 현재 셀 위에 새로운 셀이 추가됨 H 키를 눌러 다양한 단축키를 확인할 수 있음 1+2+3 6 print("Hi I'm JayJay") Hi I'm JayJay a = 10 b = a+5 b 15 print(a,b) print(0, "JayJay", a+b) 10 15 0 JayJay 25 a= 10 b = 10.5 c = "jayjay" d = (a==b) e = None print(a,b,c,d,e) print(type(a),ty..