책 속에서 찾은 나의 이야기, 데이터사이언스

Page 1

책 속에서 찾은 나의 이야기, 데이터사이언스

2022 M4 개인주제 프로젝트

아타 01
02 목차 01 책 싫어하던 나, 그 변화의 시작 02 무작정 책 읽기와 독후감 03 ‘통계’라는 관심사 발견 04 살아있는 데이터 사이언스 이야기 05 내가 생각하는 직업 가치 06 데이터는 사람을 보는 수단 07 마케팅? 사회 문제? 새로운 관점 발견 08 진로 방향 설정

책 싫어하던 나, 그 변화의 시작

‘책’

앞서, 먼저 읽을 책들을 적어내려갔

다. 이 목록에는 나에게 동기부여를 준 친구들에게 추천받은 책, 평소

생겼다. 책을 좋아하는 친구들과 대화를 하는 과정에서, 책을 읽어야

하는 이유를 느낄 수 있었던 것이다. 내가 이 친구들을 통해 느낀 것은

크게 세 가지가 있었다. 첫째, 말을 할 때 의견을 조리 있고 깔끔하게

표현했다. 어떤 논제를 가지고 이야기할 때, 유독 이 친구들의 말에는

빨려 들어가는 느낌을 받을 수 있었다. 둘째, 뚜렷한 자기 주관이 있었

다. 물론 내가 그 주관에 모두 동의하는 것은 아니었지만, 그렇게 생각

이라는 걸 하면서 산다는 것 자체가 인상적이었다.

등이 있었다. 목록을 작성하고 나서는 위에서부터 차례대로 책을 읽었

다. 또한 읽고 나서는 독후감을 작성하며 내용과 느낀 것을 정리해나

갔다. 많이 읽다 보면 나에게도 어떤 변화가 일어나겠지? 하는 막연한

기대감을 가지고, 도장 깨기 하듯 열심히 읽었다.

팩트풀니스 책 동아리에서 다같이 읽는 책

금요일엔 돌아오렴 읽고 펑펑 울어서 수필 쓴 책, 다시 읽어보고 싶음

미움받을 용기 베스트셀러이기도 하고 학교 책방에 있길래 앞부분 조금 읽어봤는데 재밌어서

요코 이야기 역사 시간에 선생님이 추천하신 책, 줄거리가 흥미로워 보여서

정해진 미래 사회와 통계에 대한 이야기, 내 관심사와 부합, 예전에 읽었는데 기억이 잘 안 남

프로보커터 고등학교 1학년 때 이 책의 일부분을 읽고 성공적인 발표를 한 적이 있어서 다 읽

어보고 싶었음

리더십 챌린지 좋아하는 인스타 계정에서 추천해서, 내가 거캠에서 이루고 싶은 것과 부합

당신은 문제해결에 얼마나 탁월한가?

친구가 이 책에 대한 이야기를 가끔 해 주어서 이야기를 듣다가 흥미가 생김

03
셋째, 그래서 너무 멋있어 보였다. 나는 이 친구들처럼
싶었다.
책을 많이 읽기 위해, 주제를 ‘책 읽고 교훈 얻기’로 선정했다.
멋있어지고
그래서
본격적으로 프로젝트를 시작하기
하면 무슨 생각이 드세요?
읽어보면
도움이 될 것 같았던 책, 그리고 코칭 선생님께 추천받은 책

무작정 책 읽기와 독후감

첫 번째 책 : 당신은 문제해결에 얼마나 탁월한가? 두 번째 책 : 프로보커터

이 책은 크게 프로보커터, 사유의 외주화, 밈에

대한 내용 3가지를 담고 있다. 현대 사회는 주

목 자체가 가치가 되는 주목 경제 사회이고, 이

런 환경에서 관심을 얻기 위해 비윤리적인 행동

도 서슴지 않는 사람들을 프로보커터라고 부른

다. 사유의 외주화는 현대인들이 카드 뉴스 등의

기서는 사례를 중심으로 설명한 부분이 많아서 문제를 푸는 느낌도 들

고, 아주 흥미로웠다. 책의 내용에서 아쉬웠던 점은, ‘때로는 비이성적

일 때도 있어야 하고 그 경우가 바로 사랑이다’라고 말했으면서 자꾸

사랑을 논리적으로 분석하려는 예시를 드는 것이었다. 표면적으로는

비이성적인 측면도 중요하다고 말하면서 실제로는 그 점을 간과하고

있다는 생각이 들었다. 이 책을 여러 번 읽는다면 다양한 논리적 사고

를 일상생활에서도 적용할 수 있을 것 같다. 우선은 작은 것부터 논리

적 사고를 실천할 계획이다.

아주 간단하고 짧은 콘텐츠로 사회 문제를 접하기 때문에 문제를 아

주 단순히 바라본다는 점이다. 그렇게 보는 게 문제는 맞지만 한편으

로는 그래도 아예 모르는 것보다는 낫지 않나? 싶기도 하다. 그런데

또 책을 읽지 않은 사람보다 한 권 읽은 사람이 더 못하다는 말도 있지

않은가. 조금 모호한 것 같다. 또한 밈이 엄청난 위력을 가진다고 언급

한 부분에 매우 공감했다. 하나의 사례로 미국에서 OK boomer 라

는 밈이 유행했었는데, 이는 한국어로 꼰대라는 의미를 정치적으로

04
사 용한 것이다. 젊은 세대는 윗세대가 제시하는 의견에 OK boomer 라 고 답함으로써 상대에게 쉽게 모멸감을 주고 그 말을 쓰는 사람들에게 는 강한 연대감을 부여할 수 있었다. 이는 전례 없는 세대갈등을 유발 했다.

무작정 책 읽기와 독후감

세 번째 책

: 팩트풀니스

책 팩트풀니스의 메시지는 ‘데이터를 통해 보

는 진실은 다른데, 왜 사람들은 세상을 나쁘게

만 인식할까?’이다. 책의 서론에서는 먼저 데이

터에 근거한 사실과, 우리의 고정관념이 얼마나

다른지 퀴즈를 통해 알려준다. ‘’ 같은 사실 퀴즈

가 13개 있었는데, 나는 무려 8개나 틀렸다.

그래서 나는 세상을 나쁘게만 인식하고 있었다는 것을 알 수 있게 되

었다. 그러면 우리는 대체 어떻게 이런 인식을 가지게 되었을까? 저자

는 그 이유를 인간이 가진 열 개의 본능으로 설명하고, 그 본능을 극복

하는 방법을 제시한다. 나는 이 본능에 휩싸이지 않게 본능 해소 방법

을 일상생활에 적용하고 있다.

내가 팩트풀니스를 읽으면서 가장 공감했던 내용은, 그래프의 구성

에 따른 인사이트 차이를 설명한

는 2016년 남학생과 여학생의 수학 점수별 학생 수를 나타낸다. 세 그

래프는 자료의 양이 모두 같거나 유사하다. 그러나 1번 그래프는 차이

심각한 것으로 보이는 반면, 2번과 3번 그래프는 차이가 별로 없는

보인다. 이렇게 우리는 통계자료를 어떻게 구성하느냐에 따라 인사이트가 크게 달라진다는 것을 알 수 있다. 굳이

05
1번과 2번 그래프 는 남학생과 여학생의 수학 점수 평균의
그래프
부분이다. 아래의
변화를 나타내고, 3번
자료의 양 자체를 조작하지 않더라도 그래프가 전하는 메시지가 이렇게나 변할 수 있다 는 것이 놀라웠다.
것으로
그래프 1 그래프 2 그래프 3 출처 : 팩트풀니스, 2018

무작정 책 읽기와 독후감

네 번째 책 : 통계로 풀어가는 빅데이터

내 방 책꽂이에 꽂혀있었지만, 1년 전에 한 번

읽다 말다시피 한 뒤 눈길도 주지 않았던 책이

다. 책 읽기를 결심한 이후 눈에 띄어 읽게 되었

다. 이 책은 데이터 사이언스가 얼마나 중요하

며 위대한지, 그 긍정적 측면을 강조한다. 내가

특히 이 책을 좋아했던 이유는, 데이터 사이언스

를 기업의 마케팅뿐만 아니라 저출산 고령화 문제 등의 사회 문제와

도 연결시켰기 때문이다. 다수의 데이터 분석은 결국 기업의 마케팅으

로 귀결되는데, 여기서는 사회 문제의 측면에서도 다룬 점이 매우 좋

았다. 그러나 책에 너무 어려운 전문 지식이 많이 나와서 건너뛰고 읽

은 부분이 꽤 있었다는 점이 아쉬웠다. 그래서 전문적인 통계 지식을

꼭 배워보고 싶다는 생각도 하게 되었다.

06

‘통계’라는 관심사 발견

씀이 크게 작용했다. ‘세연아, 너는 사회도 좋아하고, 수학 성적도 좋은

데 특히 숫자에 감이 있어 보여서 통계학과가 잘 맞을 것 같아.’라는 말

씀을 자주 하셨다. (거진 6개월 동안이나.) 당시에는 이 의견에 적극적

으로 동의하진 않았다. 그때 나는 관심 있는 학과가 딱히 없었지만, 입

시의 특성상 학과를 하나 정하고, 그것에 맞춰서 생활기록부를 만들어

가야 하는 상황이었다. 그래서 그냥 그런가 보다 하고 통계학과를 준

비했었다. 그런데 지금 생각해 보니까 선생님의 말씀이 다시 들렸다. ‘나 그때부터 싹이 보였었구나.’하는 생각이 들었다.

무렵,

그래서 프로젝트의 방향을 살짝 바꿨다. 책만 열심히 읽기보다는 통

계와 데이터를 집중적으로 탐구해 보기로 했다.

한편, 이런 생각도 들었다. 이제 내 프로젝트는 책 읽기가 아니라 데이

터 사이언스 탐구하기인데, 책 속에서의 공부만 하는 것은 조금 아쉬

운 것이다. 마침 학교에 데이터 분석가로 일하셨던 코칭 선생님이 계

시기도 했고, 이 직업에 대한 살아있는 이야기를 들어보고 싶어서 도

령 코칭 선생님을 인터뷰했다.

07
그렇게 네 권째 책을 다 읽을
선생님은 빅데이터 컨설팅 회사에서 근 무한 경험이 있으시다. 그러나 주 업무보다는 데이 터 사이언스 관련 교육 사 업에서 더 큰 보람을 느끼 셔서 거꾸로캠퍼스의 코칭 선생님으로 이직하신 분이 다. ▲ 도령과의 즐거운 인터뷰 현장

살아있는 데이터 사이언스 이야기

인터뷰를 통해 알게 된, 데이터 분석의 중요성을 보여주는 사례를 하 나 소개하겠다. 장바구니 분석은 어떤 물건이 장바구니에 담겼을 때, 이 물건과 같이 담길 확률이 높은 물건이 무엇인지 분석하는 것이다.

기저귀가 들어있는 장바구니에는 뭐가 많이 들어있었을까? 사람의 머 리로 생각해보았을 때는 분유나 젖병 등 아기용품이 먼저 떠오르기 마 련이다. 그러나 분석 결과는 아주 의외였다. 그것은 바로, ‘맥주’.

그 이유는 남편들이 퇴근길에 아내의 심부름으로 마트에 들려 기저귀

를 사면서, 보상심리로 맥주도 같이 사기 때문이다. 또는 맥주가 마시

고 싶은데, 맥주 사러 마트에 간다고 했다간 잔소리를 들을 수 있으니

기저귀를 사 온다는 핑계로 마트에 간다고 한다. 이러한 인사이트에

착안해 몇몇 마트에서는 맥주와 기저귀를 가까운 곳에 진열하기도 했

다. 이런 것처럼 빅데이터를 분석하면 우리가 머리로 생각해서 얻을

수 있는 것 그 이상의 결과

를 얻을 수 있다. 그러면 데

이터 사이언티스트는 이게 왜 연관성을 가지는지 추측

그것을 토대로 인사 이트를 뽑아내는 일을 하는

것이다.

구체적인 데이터 사이언스의 과정은 데이터 수집, 데이터 정제, 데이

터 분석, 인사이트 활용의 네 단계로 이루어진다. 데이터 수집은 말 그

대로 데이터를 모으는 단계이다. 데이터 정제 단계에서는 분석 프로그

램을 돌릴 수 있게 모든 데이터를 영어로 변환해주거나, 양식에 맞지

않는 데이터를 양식에 맞게 바꿔준다. 그리고 여러가지 분석법 중 어

떤 방법을 사용할지 결정한다. 데이터 분석 단계에서는 사실 사람이

할 일은 거의 없다. 분석 프로그램을 이용하여 컴퓨터가 분석을 하고,

여기서 나온 결과를 가지고 인사이트를 활용한다.

데이터 분석가가 가지고 있는 고충에 대한 이야기도 들을 수 있었다.

첫째, 더 많은 데이터를 볼 수 있는 권한이 없다. 빅데이터 컨설팅 회사

에서 분석을 의뢰한 회사의 데이터를 분석해주는 경우, 그 회사의 다

양한 데이터를 보기 힘들다. 둘째, 성과가

08
해보고,
눈에 보이지 않는다. 내가 낸 마케팅 제안으로 매출이 2% 증가했다고 해도 대기업의 경우 2%도 몇십억이지만, 직접적으로 성과를 느낄 수 없어서 공허한 기분을 느낀 다는 어려움이 있다. 데이터 수집 데이터 정제 데이터 분석 인사이트 활용

내가 지향하는 직업 가치

궁금해졌다. 도령은 처음부터 데이터사이언스에 흥미를 느낀 것이 아

니었고, 회사에서 퇴사하신 분이다 보니 데이터 분석가의 고충 같은

부정적인 이야기를 위주로 들을 수 있었기 때문이다. 이후 도령이 연

결해주신 현직 데이터 분석가와 인터뷰를 해 보기로 하였다.

또한 기업의 마케팅이 아닌 사회 문제를 탐구하는 데이터 사이언티스

트의 이야기도 듣고 싶어졌다. 매출이 2% 올랐다는 성과를 전해 듣

고 공허함을 느낀 이유는, 그 기업의 매출 상승이 본인에게 크게 가치

있는 일은 아니어서라고 짐작했기 때문이다.

인터뷰를 정리하는 과정에서, 나는 내가 지향하는 직업가치가 무엇인

지 생각해 보는 기회를 가질 수 있었다. 그것은 바로 사회에 없어

서는 안 될 사람, 사회 문제 해결에 기여하는 사람이다.

그래서 ‘사회 문제 해결’과 부합하는 데이터사이언스가 더 궁금해졌다.

09
인터뷰 이후에는

데이터는 사람을 보는 수단

다섯 번째 책 : 상상하지 말라

도령께서 추천해주신 통계 분야 책이다. 대한민

국 최고의 데이터 분석가인 송길영 씨가 쓰신 책

으로, 읽다 보면 데이터 뿐만 아니라 저자에게

도 빠져드는 묘한 기분을 느낄 수 있다. 이 책의

메세지는, 자신이 알고 있는 틀 안에서 사고할

수밖에 없는 인간의 한계 때문에, 우리는 상상

하지 말고 관찰해야 한다는 것이다. 앞서 인터뷰에서 등장한 장바구

니 분석만 봐도, 우리의 상상은 관찰, 즉 데이터를 넘을 수 없다. 이 책

은 이러한 데이터의 중요성을 넘어서 데이터를 보는 사람의 역량을 특

히 강조한다.

또한 나는 이 책을 읽고 ‘페르소나는 데이터를 기반으로 만들어야 돼

요’ 라는 말의 중요성을 이해할 수 있었다. 이 말은 내가 지난 모듈 팀

프로젝트에서 들었던 피드백이다.

10
그때는 페르소나를 왜 만드는지 몰 랐으나, 이 책을 읽고 난 지금은 데이터를 수단으로 사람을 들여다 보 는 엄청난 힘이 바로 페르소나에 담겨 있다는 것을 알게 되었다.

마케팅? 사회 문제? 새로운 관점 발견

다만 아직도 생기는 아쉬움은, ‘데이터 사이언스는 기업의 이윤 창출만을 위한 것인가?’ 라는 의문이 가시질 않는다는 것이다. 데이터 사이언스

와 가장 잘 연결되는것은 어떻게 보면 마케팅인데, 나는 내가 한 회사에 고용되어서 그 회사의 매출을 올리려는 목적으로만 데이터를 분석한다

면 그 일의 가치를 느끼지 못하고 공허함만 느낄 것 같았다.

이런 상황에서 나는 우연히 도령이 하시는 데이터 수업을 참관하고, 완전히 새로운 관점을 찾게 된다. 데이터 수업에서는 거캐머가 우리 팀의 상황에서 어떤 데이터가 필요하며, 어떻게 수집할 것이며, 어떻

게 활용할 것인지 진지하게 고민하는 모습을 볼 수 있었다. 그 장면을

보고 나는 기업의 이윤 창출을 위해 데이터를 분석한다는 것이 꼭 가

치가 없는 일인 것은 아니라는 생각을 할 수 있게 되었다. 내가 기업의

비전과 가치에 충분히 동의하고 있다면, 그 프로젝트에 몰입하고 있다

면 보람 있게 일할 수 있을 것이라고 느꼈다.

11

진로 방향 설정

모든 프로젝트의 과정을 거치며, 앞으로 하고 싶은 일이 생겼다

우선 거꾸로캠퍼스 내의 팀 프로젝트에서 우리 팀의 데이터를 분석하

여 인사이트를 내는 일을 하고 싶다. 데이터 수업에서 본 친구의 열정

처럼, 나도 우리 팀의 데이터를 수집하고 분석하여 활용한다면 큰 보

람을 느낄 것이다. 다음으로는 대학에서 통계학을 전공할 것이다. ’통

계로 풀어가는 빅데이터’를 읽고 전문 통계 지식에 갈망을 느꼈으며,

훗날 데이터 분석을 하기 위해서는 통계학 학위가 필요하기 때문이

다. 이후에는 스타트업의 데이터 분석가로 일할 것이다. 굳이 스타트

업인 이유는 일반 기업보다 팀원들이 조직에 애정과 열정이 있다는 점

을 고려했다. 궁극적으로 나는 이 사회에서 꼭 필요한 사람이 되고 싶

다. 그러기 위해 ‘사회 문제 해결’에 기여하는 데이터 사이언티스트가 될 것이다.

단순히 책 많이 읽는 사람이 멋있어보여서 시작한 프로젝트가, 진로

를 고민하게 하고 내 삶의 가치관까지 정립하게 해 주었다. 정말 책 읽

기 잘한

12
것 같다는 생각이 든다. 역시 독서의 힘은 위대했다. 나의 독서 는 여기서 그치지 않을 것이고, 앞으로도 책에서 더 많은 것을 얻으며 성장할 것이다. 아이콘 출처 몺aticon | 이미지 출처 pixabay | 글씨체 출처 Line Seed Sans KR

Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.