Data Analysis

작성일자 : 2023-10-23 Ver 0.1.1 '나비효과'라는 말이 있다. 어느한곳에서 발생한 나비의 날개짓이 지구 반대편에서의 태풍을 일으킬 수도 있다는 이론으로 초기의 사소한 변화가 전체의 막대한 영향을 미칠 수 있다는 뜻으로 우리 일상생활에 자주 사용된다. 그렇다면 실제로 나비의 날개짓만으로 태풍이 일어날까? 그렇지 않다. 나비의 날개짓이 지닌 영향력은 매우 미미한 수준이다. 또한 수많은 나비가 날아다녀도 태풍으로부터 안전하다. 최근에 새로운 광고를 런칭했으면 광고 클릭 수가 늘었더니 DAU(Daily Active User) 지수가 늘어난다는 것이 보인다는 사람도 있을 것이고, 새 상품을 출시했더니 매출이 증가하는 것부터 보이는 사람들도 있을 것이다. 하지만 이 모두는 맞지 않다. 이를 항변하기..
In [1]: import pandas as pd import numpy as np from sklearn.preprocessing import MinMaxScaler In [52]: df = pd.read_csv('mtcars.csv') df.head() Out[52]: model mpg cyl disp hp drat wt qsec vs am gear carb 0 Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4 1 Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4 2 Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1 3 Hornet 4 Drive 21.4 6 258...
작성일자 : 2023-10-21 Ver 0.1.1 지난 빅데이터분석기사 제7회 필기 시험을 통과했고, 실기 시험 준비를 하고 있다. 실기 시험을 준비하는데 있어서 다양한 후기들을 보았고, 나를 위해 그리고 시험을 앞둔 사람들에게 조금이나마 도움이 되길 바라며 몇몇 주의사항 및 Tip 그리고 도움이 될만한 사이트를 정리했다. 주의 사항 및 Tip VS 코드 .py 파일로 연습할 것 시험 환경에서는 Jupyter Notebook과 같이 코드를 한줄한줄 실행할수 없다. 이에 중간중간 print 함수와 주석을 잘 활용하여 코드가 잘 실행되고 있는지 확인해봐야한다. 이러한 과정들을 .inpynb 파일이 아닌 .py 파일 형태로 연습해보길 권유한다. .inpyb 파일로 하게될 시에는 코드 블럭 하나에서 연습하는 습..
제 2유형¶출제 경향¶ 회차 분류 or 회귀 성능지표 6회 분류(Classification) macro F1 Score 5회 회귀(Regression) RMSE 4회 분류(Classification) macro F1 Score 3회 분류(Classification) Accuracy 2회 분류(Classification) AUC 분석 순서¶ 라이브러리 및 데이터 확인 데이터 탐색(EDA) 데이터타입, 결측치, 기초통계량 등 데이터 전처리 및 분리 결측치 / 이상치 : 대체 or 삭제 변수처리 : 변수 선택/추가, 원핫인코딩 모델링 및 성능평가 분류 : RandomForestClassifier .Accuracy, F1 Score 회귀 : RandomForestRegressior .R2, MSE, RMSE 예..
Unlimited Jun
'Data Analysis' 카테고리의 글 목록 (6 Page)