작성일자 : 2023-11-18
Ver 0.1.1
1. 이 책을 읽게 된 동기
데이터 분석가로서 이목이 집중되는 책의 제목이어서 읽게 되었다. 요즘은 본격적인 자격증 공부때문에 독서에 할당한 시간을 줄인 상태였는데, 만화로 구성되어 있어서 쉽게쉽게 읽을 수 있는것 같았다. 아직 완독한 것은 아니지만, 중간중간 짬을 내서 읽어보려 한다.
2. 한 줄 소개글
데이터 분석가로서 데이터 문해력을 키워주는 책
3. 기억하고 싶은 문장
3-1) 상관관계는 인과관계가 아니며, 특히 수많은 외생변수가 여기저기 떠다니는 현실 데이터 분석에는 더욱 그렇다. (p.28)
선정이유 : 간혹 상관관계와 인과관계를 동일시 하는 사람 혹은 경우가 있곤 한다. 이는 심각한 통계적 오류이며, 업무와 일상생활에서 범하면 위험한 오류이다. 다시한번 경각심을 깨닫게 되었다.
3-2) 수학은 불확실성 위에 쌓아 올려진 학문이고, 통계는 항상 확률과 같이 등장하며, 숫자는 한 번도 절대적인 적이 없다 (p.49)
선정이유 : '숫자'의 딜레마에 대해서 잘 보여준 표현이다. '숫자의 차이'는 절대적인 것 처럼 보이고, 나역시 절대적인 값으로 생각을 하던때가 있곤 했다. 그렇지만 세상은 가변적이고, 크게 봤을 때는 동일한 것도 나눠서보면 다르기에 여러 면으로 고민해야한다.
3-3) 단순히 숫자를 보고, 또는 '빅데이터'를 손에 쥐고, 이제 모든 것을 다 가졌다는 착각을 하고야 만다. (p.74)
선정이유 : 데이터 분석 기술이 발전하며, 전수조사를 대신하는 표본조사가 만연해졌고, '큰 수의 법칙'에 의해 표본의 크기가 충분히 크다면 그때의 충분히 평균은 모평균에 충분히 가까워 진다. 아무리 전체 데이터를 사용한다해도, 그 데이터가 다양한 사람 모두를 대표할 수는 없고, 이를 종종 잊어버리곤 한다. 단순히 빅데이터라는 이유로 오류를 범하지 말아야 한다.
4.독후소감
정보의 바다의 시대, 데이터의 시대의 살고 있는 데이터 분석가로서 데이터 문해력을 키워주고, 기존에 알고 있는 개념 및 오류들에 대해서 상기시켜주는 책이다. 만화로 구성되어 있어 쉽게 쉽게 읽을 수 있고, 비즈니스 적인 사례들로 구성해두어 이해가 편하다. 아직 완독을 하진 못했지만 꼭 완독을 할 것이고, 데이터 문해력을 갖춘 좋은 데이터 분석가가 되도록 해야겠다.
5. 나의 어록
데이터는 숫자의 일종이며, 절대적인 적이지 않다. (숫자는 한번도 절대적인 적이 없다, P49)