In [1]: import pandas as pd import numpy as np from sklearn.preprocessing import MinMaxScaler In [52]: df = pd.read_csv('mtcars.csv') df.head() Out[52]: model mpg cyl disp hp drat wt qsec vs am gear carb 0 Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4 1 Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4 2 Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1 3 Hornet 4 Drive 21.4 6 258...
실기
제 2유형¶출제 경향¶ 회차 분류 or 회귀 성능지표 6회 분류(Classification) macro F1 Score 5회 회귀(Regression) RMSE 4회 분류(Classification) macro F1 Score 3회 분류(Classification) Accuracy 2회 분류(Classification) AUC 분석 순서¶ 라이브러리 및 데이터 확인 데이터 탐색(EDA) 데이터타입, 결측치, 기초통계량 등 데이터 전처리 및 분리 결측치 / 이상치 : 대체 or 삭제 변수처리 : 변수 선택/추가, 원핫인코딩 모델링 및 성능평가 분류 : RandomForestClassifier .Accuracy, F1 Score 회귀 : RandomForestRegressior .R2, MSE, RMSE 예..