Data Analysis/빅 데이터 분석기사

작성일자 : 2023-08-22 Ver 0.1.1 1. 데이터 탐색 1.데이터 탐색 2.기초 통계 3.상관 관계 분석 4.다변량 데이터 탐색 1. 데이터 탐색 데이터 탐색(DEA: Data Exploratory Analysis)은 어떤 변수 간 가설을 검증하거나 분석결과를 보고하기 위한 목적보다는 연구자가 본격적인 분석에 들어가기에 앞어, 전반적인 자료의 응답 및 분포 경향을 파악하기 위한 분석 방법 데이터 탐색이 충실해야 성능 좋은 모델을 얻을 수 있음 목적 |1.단일 변수별 데이터 탐색|2.두 변수 간의 데이터 탐색| |:—————-|:——————| |-자료입력의 실수나 이상값을 탐지하고(이상치 제거) -분석의 가정이 충족되는지 파악하며(정규성 등) -자료 단위를 변환할 필요가 있는지 검토(자료변환 ..
작성일자 : 2023-08-21 Ver 0.1.1 1. 데이터 정제 1.결측값(Null) 2.이상값(Outlier) 1-1. 결측값(Null) 종류 결측 유형 설명 완전 무작위 결측 (Missing Completely At Random) 난수처럼 경향성 없이 완전 무작위로 결측값 발생 무작위 결측 (Missing At Random) 경향성을 띄고 있으면서 무작위로 결측값 발생 비 무작위 결측 (Missing Not At Random) 경향성을 띄고 있는 결측값 발생 처리 방법 (제거? or 대체?) 완전 분석법(Completes Analysis) 결측값이 존재하는 행 단순 삭제 삭제 되는 행이 많아지면 데이터 분석에 문제가 생김(데이터 수집 단계에서 문제가 있는 것) 평균(중앙값) 대체볍(Mean Imp..
Unlimited Jun
'Data Analysis/빅 데이터 분석기사' 카테고리의 글 목록 (6 Page)