작성일자 : 2023-12-08
Ver 0.1.1
0. Intro
2021년 8월 9일부터 나는 데이터분석가로서 활동하고 있고, 어느덧 3년차이다.
일을 하면 할 수록 더 능력있는 데이터 분석가로 성장하고 싶은 마음이 커지고, 일이 재미 있음을 느끼고 있는 중인 나는 분명 행복한 데이터 분석가임은 틀림이 없다.
물론 그동안 모든 일이 쉽지 만은 않았다. 프로젝트 상황에 따라 밤을 샌적도 있었고, 로직 구현을 위해 야근을 정말 잦게 하던 때도 있었다. 예비군 훈련을 마치고도 바로 출근을 한다거나, 주말 출근을 하던 때도 있었다. 이런 순간들을 반드시 겪을 필요는 없지만, 그래도 이런 순간들이 있었기 때문에 성장을 많이 할 수 있었던 것은 부정할 수 없다.
IT 산업의 기술 발전은 하루 하루 정말 빠르게 진행되고 있으며, 이 분야에서 일을 하면 할 수록 더 알아야 할것이 많은 것 같다는 생각이 든다. 이제는 IT 또는 데이터와 관련된 직군이 아니어도 데이터를 잘 다루기위해 직무의 범위를 늘리려 하거나, 직무 자체를 데이터 직무로 바꾸려는 사람들도 많아진 것 같다. 또한 데이터 관련 직무에서 일을 하고 싶어 하는 학생들도 많아지고, 관련 산업의 취업 준비생들 역시 증가한 것으로 보인다.
나 역시 이러한 시절이 있었다. 학생인 시절이 있었고, 상대적으로 짧긴 했지만 취업준비를 하던 순간들이 있었다.
그래서 나의 과거를 회고해보고, 데이터 분석가를 꿈꾸는 사람들에게 글로서나마 영감과 동기부여가 되고, 조금이나마 도움이 되기 위해 글을 작성해보려 한다.
지난 글을 통해서 학부생 시절 통계학 이중전공으로 선택한 이유와 동기부여 그리고 고민들에 대해서 작성해보았다.
이번 글에서는 통계학을 공부하면 느끼고 배운것들 그리고 나에게 생긴 변화에 대해서 정리해보겠다.
1. 데이터 시각화
기초통계 1/2 , SAS 통계학, 확률분포론, 선형대수학, 수리통계학, 회귀분석, 데이터마이닝, 금융수학, 탐색적 자료분석, 통계적방법론, 통계적 기계학습 및 실습, 데이터 시각화 등등..
위 수업들은 내가 통계학 수업들 중 일부다. 위 수업들을 포함하여 총 44학점을 수강했고, 그 끝에 이학사를 취득했다.
이 밖에도 통계학 수업은 정말 다양하게 존재했는데, 대학 생활을 경험한 사람이라면 모두 공감할 것이다.
내 스케줄에 최대한 맞게 그리고 성적도 잘 받을 수 있는 그런 수업들을 잘 골라 수강해야했다. 학생에 따라 교수님이 누구인지, 수업방식은 어떻게 되는지에 대한 것도 수강신청에 있어서 판단 기준이 되기도 한다. (전공 필수 수업은 물론 고려사항도 아니지만..ㅎ)
통계학에는 정말 많은 통계 이론과 기법들이 있다. 이중전공생으로서 공부했지만, 내가 접해본 개념들보다 접해보지 않은 개념이 아마 훨씬 더 많을 것이다. 그래도 수업을 거듭할 수록 어려운 개념들도 접하곤 했지만, 그중에서도 특히 재밌는 부분이 있었다. 바로 '시각화'였다.
복잡한 풀이 과정이나 복잡한 수식 또는 데이터들을 보기 좋게 그리고 이해하기 쉽게 만드는 시각화가 나는 재미있었다. 명확하게 눈에 보이는 결과가 있어서 그런 것도 같았다. 그리고 시각화 결과를 통해 그 속에서 숨은 의미와 인사이트를 찾아내는 그 과정 역시 재밌게 느껴졌다.
데이터 시각화에 흥미가 생겨 고학년때는 탐색적 자료분석과 데이터 시각화 수업을 수강했다. R의 ggplot과 python의 seaborn 라이브러리를 활용해 데이터를 시각화하는 수업들 이었다. 진짜 재밌게 들은 통계학 수업들이다.데이터 시각화의 흥미는 통계학 수업으로만 그치지 않고, 나의 주전공 수업의 적용으로 이어졌다. 산업적인 측면에서도 스포츠와 통계 그리고 데이터는 이미 뗄레야 뗄 수 없는 관계였고, 학문적으로도 발표자료에 시각화 자료를 넣는 것 역시 좋은 발표자료의 요건이었다. 이에 수업의 발표 자료에 내가 직접 시각화한 결과를 넣어 발표하기도 했다.
이렇게 4학년을 보내고 있을 때, 학교 선배님의 소개로 Tableau 라는 시각화 툴을 알게 되었다. 선배님 회사에서 사용하고 있는 툴인데, 그당시 선배님이 말씀하시길 Excel과 Powerpoint를 적절히(?) 합쳐 놓은 것이라고 설명해주셨던 것이 아직도 기억에 선명하다. 선배님께서 내가 시각화를 좋아하는 것에 대해서는 모르셨겠지만, 통계학을 공부하는 것을 알고계셨기에 공부해보는 것을 한번 권유해주셨던 것이다.
데이터 시각화를 좋아하는 나에게 이런 툴에 대한 공부는 너무나도 재밌었고, 처음엔 코드기반이 아닌 GUI에서 R이나 Python에 비해 상대적으로 쉽게 데이터 시각화를 할 수 있다는 것이 매력적이기도 했다. 마침 학생 라이센스로 1년을 무료로 사용할 수 있어 각종 영상을 참고하며 Tableau 독학했다.
그 이후 취업할 때까지의 중간 과정을 많이 생략했지만, 그때의 경험이 계속 이어져 현재 Tableau 대시보드 개발을 메인 직무로 하는 일을 하고 있다. 참으로도 신기한 일이고, Tableau를 나에게 알려준 선배님께도 매우 감사하다. 물론 공부하기로 마음을 먹은 것은 나의 선택이 맞지만, 알지 못했더라면 그때 그 선택은 없을 확률이 컸을것이기 때문이다.
Tableau를 알게된 것은 운이 좋았던 것이라고 생각하지만, 데이터 시각화에 흥미가 있다는 사실은 해보지 않으면 몰랐을 일이다. 이에 내가 하고 싶은 말은 다양한 것을 직접 경험해 보는 것이다. 나는 통계가 어려웠다. 그때보다는 더 많이 알고 있는 지금도 결코 통계가 쉽다고 말할 수는 없다. 이렇게 어려웠음에도 그 중에서도 재미있는 분야가 있었다. 어쩌면 이것 역시 운이 좋았다라고 볼수도 있다. 재미있는 분야가 없을 수도 있기 때문이다. 말장난처럼 들릴수 있지만, 그래도 안해보면 나에게 재미가 있는지 없는지 알수 있는 기회조차 없는 것이다. 해보지도 않고 미리 걱정하지말고, 다양한 경험을 해보면서 나에게 맞는 것인지 안맞는것인지 판별을 해보면 좋겠다.
2. 논리적 사고 방식 & 분석 및 문제 해결 능력
통계학은 내용 자체가 어려워 공부하는 데 있어서 어려움이 있었던 것도 사실이지만,
이를 통해 얻은 값진 것들도 있다. 통계학은 나로 하여금 논리적인 사고방식, 분석 및 문제 해결 능력을 향상시켜주었다.
단적인 예로 귀무가설과 대립가설을 세워 검정통계량을 통해 가설검정을 하는 것. 평소에 이런 가설검정 형태로 사고방식이 이뤄지지 않았기 때문에 처음에는 가설검정에 사용되는 용어와 개념들 그리고 가설검정이라는 방법론에 대한 이해가 잘되지 않았다. 그러나 점점 더 공부할수록 적응도 되고 다양한 검정방법으로 가설 검정을 하는 것만으로도 나의 사고방식 변화에 큰 영향을 주었다.
또한, 데이터를 요약하고 시각화 하여 의사결정을 위한 근거 자료로서 활용하는 것. 이것이 바로 시각화의 장점이기도 하다. 데이터 시각화를 통해 의사결정을 위한 근거 자료가 되고, 복잡한 데이터들을 보기 쉽게 보여줄수도 있다. 이 역시 논리적인 사고를 위한 발판이자 분석 능력 역시 향상 시켜주었다.
다양한 통계 기법을 공부하는 것 역시 나의 논리적 사고 하는 방식에 기여했다. 통계학에 대한 개념 및 이론은 정말 많으며, 끝없이 발전하는 분야이기도 하다. 새로운 도구와 방법을 배우고 이해하고 익히는 과정에서 지속적인 학습이 필요한데, 이를 통해 논리적 사고력을 더욱 향상시키고, 새로운 도전에 대처할 수 있는 능력을 키울 수 있었다.
더 나아가 통계 문제를 접했을 때 문제에 대한 분석을 통해 어떻게, 어떤 기법을 통해 문제를 풀어야 할지, 코딩에서 에러가 발생했을 때는 에러 및 문제 해결을 위해 코드를 분석하는 시간들은 나의 분석 능력과 문제 해결 능력을 향상시켜주었다.
나의 논리적 사고 방식과 분석 및 문제 해결 능력에 기여해준 내용에 대해서 비교적 간략히 정리해보았으나, 통계학은 나에게 지대한 영향을 끼쳤다. '사고방식'은 생각하는 방식이다. 사고방식에 따라 한 사람의 신체적, 정신적 건강에 영향을 주고, 우리의 수많은 의사결정의 기반이 된다. 통계학은 단순히 통계적 지식 습득을 넘어서 나라는 사람의 사고방식에 좋은 영향을 미쳤다.