Data Analysis

작성일자 : 2023-10-08 응시 이유 지난 9월 23일 ,제 7회 빅데이터분석기사 필기 시험을 응시했다. '자격증 취득'에 대한 나의 평소 생각은 업무를 하면서 필요에 의해, 혹은 자기계발을 위해 취득하는 것은 도움이 된다고 생각하지만 자격증 취득 자체가 주된 목적이 되면 안된다는 것이다. 자격증이 있다는 사실이 무조건 업무를 잘할 것이라는 의미는 아닐것이기 때문이다. 일명 '보여주기식' 취득만은 하지 않고 싶었다. 개인적으로는 적어도 1년에 1개씩은 직무와 관련된 자격증을 취득하는 것이 목표였다. 자기계발과 업무와 관련된 지식을 확장하기 위해서이다. 이에 22년도에는 SQLD를 취득했고, 현재 프로젝트와 내가 하고 있는 데이터 분석 업무에 예상한 정도 이상으로 정말 많은 도움이 되고 있다. 23년..
작성일자 : 2023-10-02 Ver 0.1.1 통계적 데이터 분석 절차 1. 기술적 데이터 분석 ((Descriptive Data Analysis) - 데이터의 구조 / 타입 -> 목표 변수 설정 / 기술통계량 분석(평균 / 표준편차 / ... ) 2. 탐색적 데이터 분석 (Exploratory Data Analysis) - 데이터의 트렌드 확인, 데이터 시각화 -> 데이터 현황 파악 (연관성 / 관계성 / ... ) 3. 확증적 데이터 분석 (Confirmatory Data Analysis) - 통계적 가설검정 -> Insight 도출 4. 예측적 데이터 분석 (Predictive Data Analysis) - 수식 도출 (시스템화) 기술적 데이터 분석 절차 1. 데이터 수집 - 장치를 통한 또는 ..
작성일자 : 2023-08-22 Ver 0.1.1 1. 데이터 탐색 1.데이터 탐색 2.기초 통계 3.상관 관계 분석 4.다변량 데이터 탐색 1. 데이터 탐색 데이터 탐색(DEA: Data Exploratory Analysis)은 어떤 변수 간 가설을 검증하거나 분석결과를 보고하기 위한 목적보다는 연구자가 본격적인 분석에 들어가기에 앞어, 전반적인 자료의 응답 및 분포 경향을 파악하기 위한 분석 방법 데이터 탐색이 충실해야 성능 좋은 모델을 얻을 수 있음 목적 |1.단일 변수별 데이터 탐색|2.두 변수 간의 데이터 탐색| |:—————-|:——————| |-자료입력의 실수나 이상값을 탐지하고(이상치 제거) -분석의 가정이 충족되는지 파악하며(정규성 등) -자료 단위를 변환할 필요가 있는지 검토(자료변환 ..
작성일자 : 2023-08-21 Ver 0.1.1 1. 데이터 정제 1.결측값(Null) 2.이상값(Outlier) 1-1. 결측값(Null) 종류 결측 유형 설명 완전 무작위 결측 (Missing Completely At Random) 난수처럼 경향성 없이 완전 무작위로 결측값 발생 무작위 결측 (Missing At Random) 경향성을 띄고 있으면서 무작위로 결측값 발생 비 무작위 결측 (Missing Not At Random) 경향성을 띄고 있는 결측값 발생 처리 방법 (제거? or 대체?) 완전 분석법(Completes Analysis) 결측값이 존재하는 행 단순 삭제 삭제 되는 행이 많아지면 데이터 분석에 문제가 생김(데이터 수집 단계에서 문제가 있는 것) 평균(중앙값) 대체볍(Mean Imp..
Unlimited Jun
'Data Analysis' 카테고리의 글 목록 (7 Page)