컨텐츠상세보기

데이터 과학자의 일 - 금융, 게임에서 스포츠까지 현장에서 찾아낸 데이터 과학의 오늘 (커버이미지)
알라딘
데이터 과학자의 일 - 금융, 게임에서 스포츠까지 현장에서 찾아낸 데이터 과학의 오늘
  • 평점평점점평가없음
  • 저자박준석 외 지음 
  • 출판사휴머니스트 
  • 출판일2021-10-17 
보유 1, 대출 0, 예약 0, 누적대출 0, 누적예약 0

책소개

데이터 과학자는 어디에서 무슨 일을 할까?
전문가 11명의 생생한 목소리가 전하는 데이터 과학의 현주소

최근 데이터 과학, 빅데이터, 머신러닝 등의 용어가 여기저기서 들리고 있다. 그런데 정작 데이터 과학자들이 구체적으로 어떤 일을 하는지, 데이터 과학이 각 분야에서 어떻게 활용되며 세계를 바꾸고 있는지 확인하기는 어렵다. 이 책은 다양한 분야에서 활동하고 있는 데이터 과학자들이 모여 데이터 과학의 현재를 이야기한다. 연구방법론, 인공지능과 머신러닝, 결측데이터 등 데이터 과학의 이론과 발전에 관한 이야기부터 금융, 게임, 스포츠, 보안, 의학, 교육 등의 분야에서 데이터 과학이 어떻게 활용되는지에 관한 이야기까지, 데이터와 정보에 둘러싸여 살아가는 현대인이라면 꼭 알아야 할 흥미로운 내용이 가득하다.

1. 데이터 과학자의 일은 어떻게 우리의 현실이 되는가?
- 현장에서 써 내려간 데이터 과학 현장 보고서

데이터를 ‘21세기의 원유’에 비유하고, 데이터 과학자를 ‘21세기의 가장 섹시한 직업’이라고 말하는 시대다. 인공지능, 빅데이터, 머신러닝, 딥러닝 등 데이터 과학 관련 용어는 IT·경제 뉴스에서 쉽게 접할 수 있는 일반 용어가 되었다. 무엇보다 데이터 과학은 온라인 쇼핑몰이나 유튜브·넷플릭스 등 미디어 콘텐츠 플랫폼의 추천 시스템에 활용되어 어느새 우리의 선택마저 좌우하는 막대한 힘을 발휘하고 있다. 그런데 이 같은 큰 관심과 영향력에도 불구하고 데이터 과학이 어떤 분야에서 활용되는지, 데이터 과학자들은 각 분야에서 구체적으로 어떤 일을 하는지 소개해주는 책은 찾아보기 어렵다.
이 책 《데이터 과학자의 일》은 금융, 게임, 스포츠, 보안, 의학, 교육 등 다양한 분야에서 활약하는 데이터 과학자들의 생생한 목소리로 데이터 과학을 소개한다. 이들이 업계의 환경과 목표에 따라 좋은 데이터를 수집하고, 수집한 데이터의 의미를 분석하고, 이를 바탕으로 ‘데이터 기반 의사 결정’을 하는 일련의 과정은 데이터 과학이 우리 삶을 어떻게 변화시키고 있는지를 여실히 보여준다. 다양한 데이터 과학자가 현장에서 겪은 실제 사례를 통해 보여주는 지금 여기의 데이터 과학은 어떤 모습일까?

금융 산업에서 데이터 과학이 적용되는 분야는 무궁무진하다. 세계 최고의 투자은행이라는 골드만삭스의 경우, 명문 대학교 MBA 출신의 트레이딩 전문가가 600명에서 2명으로 줄어들었고, 이제 그 일을 데이터를 학습한 컴퓨터가 담당하고 있다. 회장 스스로 골드만삭스는 IT 회사라고 부른다. 인공지능과 딥러닝의 등장으로 금융 산업 자체가 커다란 변화의 시기를 맞이한 것이다. 인류의 역사가 시작된 이래로 존재했던 금융 산업은 1차, 2차, 3차 산업혁명 시대에도 흔들림 없이 그 자리를 지켜왔다. 하지만 인공지능의 등장으로 시작된 4차 산업혁명 시대에는 커다란 변신을 요청받고 있다. 변화하지 않으면 도태되기 때문이다.
- 〈3장 핀테크와 테크핀이 경쟁하는 시대의 금융〉 중에서(67~68쪽)

비교적 단순한 구조의 퍼즐 게임에서는 보통 서로 게임 플레이 기록을 공유함으로써 자신의 기록을 자랑하거나, 다른 사람의 추천을 통해 자신에게 필요한 아이템을 얻는 방식으로 신규 유저를 확보하는 등의 기능을 제공한다. (중략) 플레이어 간의 상호 작용이 더 적극적인 게임이라면 더 세밀한 데이터가 기록될 수 있다. 이를테면 1인칭 슈팅(FPS) 게임의 경우 누구와 대결했는지, 전적이 어떻게 되는지, 어떤 방식으로 승리 혹은 패배했는지, 대결 결과가 나오기까지 시간이 얼마나 걸렸는지, 대결 과정에서 어떤 기술을 이용했는지 등이 기록될 수 있다. 심지어 자유도가 높은 대규모 다중 사용자 온라인 롤플레잉 게임(MMORPG)의 경우, 조금 과장하자면 현실 세계에 거의 근접한 수준의 활동들이 기록된다. 이처럼 세밀하고 풍부한 데이터가 있기 때문에 데이터 분석가에게 게임은 참으로 매력적인 분야가 아닐 수 없다. 비유하자면 세상에 존재하는 온갖 재료가 가득 담긴 초대형 냉장고 앞에 선 요리사가 된 기분이다.
- 〈4장 게임, 가장 풍부한 데이터가 뛰노는 세상〉 중에서(77~78쪽)

만약 여러분이 보안 도메인의 데이터 과학자라면 다른 영역의 데이터 과학자에게는 일반적으로 없는 특별한 것이 하나 있다. 그것은 바로 구체적인 악의를 가진 적이다. 여러분이 상대해야 하는 적은 다양할 수 있다. 악성 행위를 반복하는 사용자부터 악성코드를 심으려는 해커, 규약을 지키지 않고 서비스로부터 데이터를 수집하려는 크롤러 제작자에 이르기까지 다양하다. 여러분의 업무는 그 적을 분석하고 탐지하고 예측하여 더는 위협적이지 않은 상태를 가능한 한 길게 유지하는 것이다. 이 글에서는 데이터 과학자이기 전에 서비스를 보호한다는 분명한 목적을 가진 사람으로서 이 같은 적들을 상대하려면 무엇을 공부해야 하고, 어떤 준비가 필요한지 이야기하고자 한다. 물론 데이터 과학과 보안의 연관성에 대해서도 다룰 것이다. 마지막으로 악의적인 크롤러 방어와 관련된 구체적인 사례를 소개하며 앞에서 설명한 준비와 실무가 어떻게 적용되는지 함께 살펴보겠다.
- 〈6장 데이터 과학으로 서비스를 보호하는 방법〉 중에서(125~126쪽)

선진국의 경우 대개 인구 구조가 어느 정도 고령화되어 대부분 고령층이 인구의 10~20%에 달한다. 선진국의 경우 코로나-19 발생 초기부터 고령 감염자들의 사망률이 높다는 데이터가 축적되어 있었다. 그리고 이러한 국가에서는 방역을 위한 거리 두기가 가능하며 마스크를 구입하고 보급할 수 있는 경제적 여유가 있는 경우가 많다. 그래서 우리나라를 포함한 선진국의 경우 고령층부터 먼저 백신 접종을 하였으며, 감염 후 사망률이 상대적으로 낮은 연령층은 백신 접종 순위를 늦추었다. 하지만 캐나다의 노스웨스트 준주와 같이 인구 밀도가 매우 낮고 의료 자원이 부족한 곳에서는, 고령층과 함께 교통이 매우 불편한 곳에 거주하는 사람들을 백신 접종의 우선 순위로 지정했다. 코로나-19가 확산될 때 이들이 충분한 진단 및 치료를 받지 못할 가능성이 높다고 보았기 때문이다.
- 〈7장 병원, 의학 정보를 다루는 데이터 센터가 되다〉 중에서(156~157쪽)

2. 예비 데이터 과학자를 위한 커리어 가이드
- 프로그래밍 언어와 수식 없이 탐색하는 데이터 과학의 길

이 책을 집필한 데이터 과학자 11명은 모두 현재 데이터 과학을 활용·연구하는 전문가들이다. 그런데 ‘데이터 과학자’라는 하나의 직업으로 묶이는 저자들이 일하는 현장은 아마존, 마이크로소프트, 네이버, 카카오, 엔씨소프트 등 글로벌 IT 기업부터 신한은행, 서울대병원, 미시간대학교 등에 이르기까지 다양하다. 이들이 데이터 과학에 관심을 갖고 데이터 과학을 공부한 계기 또한 천차만별이다. 이렇듯 데이터 과학자가 되는 길은 단일하지 않다.
이 책은 다양한 경로로 데이터 과학자가 되었으며, 다양한 분야에서 일하고 있는 저자들의 다채로운 이야기를 담았다. 각 분야에서 성공적인 커리어를 쌓고 있는 이들의 이력과 현장 기록은 데이터 과학자가 되길 꿈꾸는 취업 준비생과 청소년에게 훌륭한 가이드가 된다. 특히 데이터 과학을 탐색해보고 싶지만 프로그래밍 언어와 수식의 벽에 부딪쳐 갈피를 잡지 못하는 사람이라면 이 책에 담긴 저자들의 업무 경험이 좋은 참고가 될 것이다.

‘21세기 가장 섹시한 직업’이라 불리는 데이터 과학자들은 정작 어디에서 무엇을 하고 있을까요? 짐작이 가시나요? 그동안 시중에 데이터 과학을 소개해주는 책이 많이 출간되었습니다. 그런데 이 책들은 대개 기술 입문서에 가깝습니다. 실제로 데이터 과학이 다양한 분야에서 어떻게 응용되는지, 구체적으로 우리 삶을 어떻게 편하게 만드는지, 어떤 가치를 창출하는지에 대해서는 별로 이야기해주지 않았습니다. 데이터 과학에 대해 잘 모르는 사람이 처음 입문할 때는 물론 이론 공부가 꼭 필요합니다. 하지만 다른 한편으로 큰 그림을 보고, 다양한 실제 사례를 접하며 흥미를 갖는 것도 큰 도움이 될 수 있습니다. 그런 동기부여가 이론 공부로 이어지는 선순환 구조를 갖추면 더할 나위 없이 좋을 겁니다.
- 〈들어가며〉 중에서(6쪽)

“세상에, 네가 은행에서 일을 한다고?” 오랜만에 만난 대학 동창과의 술자리에서 친구들이 토끼 눈을 뜨고 물었다. 비단 친구들만이 아니다. 아내에게 처음 회사를 옮기겠다는 말을 전했을 때도, 누구보다 나를 잘 알고 내 편이었던 아내마저도 의아하게 생각했으니 그리 놀랄 일은 아니었다. 전자공학을 전공했고, 전자공학의 다양한 분야 중 로봇이 사물을 어떻게 바라보는지를 연구하는 컴퓨터 비전이라는 학문을 공부한 필자에게 금융권, 그것도 은행은 단 한 번도 생각해본 적 없는 선택지였다. 게다가 남들이 부러워하는 글로벌 기업의 중앙 연구소를 떠나 선택한 곳이 은행이었으니 말이다.
- 〈3장 핀테크와 테크핀이 경쟁하는 시대의 금융〉 중에서(53~54쪽)

필자는 데이터 과학자로서 취업을 희망하는 요즘 사람들과는 달리, 엔지니어링을 깊이 공부한 이력이 없다는 점에서 약간 특이하다. 구체적으로 말하자면 석사 과정에서 데이터 시각화 분야를 연구했고, 환자의 의학 검사 데이터를 기반으로 만성도를 분류할 수 있는 프로그램 개발 과정에 관여하며 데이터의 실질적인 활용 방안을 제안하는 데 참여했다. 하지만 이렇게 여러 분야를 연구했다고 해서 컴퓨터과학 및 통계학 모두에 능통하다고는 볼 수 없는 상태였다. (중략) 이렇듯 필자는 사람들이 흔히 상상하는 ‘데이터 과학자’의 이미지와는 상당한 거리가 있었음에도, 언젠가 데이터 과학자가 되어 일하고 싶다는 꿈을 가지고 있었고, 언젠가 그런 자리에서 대단한 일을 해내고 싶었다.
- 〈9장 예비 데이터 과학자를 위한 취업 분투기〉 중에서(190~191쪽)

3. 당신의 데이터 문해력을 업그레이드하라
- 데이터 시대의 기본 소양을 키우는 최고의 지침서

데이터 과학이 아무리 중요하더라도 모두가 데이터 과학자처럼 프로그래밍 언어를 다루고 데이터를 분석할 필요는 없다. 하지만 수많은 기업과 공공기관에서 데이터를 기반으로 의사를 결정하고 정책을 도입하는 현실에서 데이터의 정보와 숨은 의미를 파악하는 능력은 무척 중요해졌다. 바로 ‘데이터 문해력’이 데이터 시대를 살아가는 현대인이라면 꼭 갖춰야 하는 기본 소양이 된 것이다. 이 책은 데이터 과학자가 문제를 설정하고 데이터를 분석하는 과정, 시행착오를 거치며 의미를 찾아내는 과정을 오롯이 보여줌으로써 ‘데이터에서 유용한 통찰을 얻는 법’을 이해하도록 돕는다. 데이터에서 비즈니스 인사이트를 찾고자 하는 독자, 데이터 문해력을 기르고자 하는 독자에게 꼭 필요한 데이터 해석 훈련법이다.

지은이 소개

박준석 (1장)
심리학자이자 데이터 과학자. 미국 서부의 한 회사에서 데이터 과학자로 일하고 있다. 페이스북 ‘오하이오의 낚시꾼’ 페이지에서 통계학, 데이터 과학 등에 관한 글을 쓴다.

손승우 (2장)
마이크로소프트 데이터·응용과학자. 머신러닝을 활용한 각종 자연어처리 및 추천 시스템을 개발하여 Windows, Bing.com 등의 제품에 출시하는 업무를 담당한다.

우지환 (3장)
고려대학교 기술경영전문대학원 겸임교수이며 AI 과학자. 컴퓨터 비전을 전공하며 시장에서 가치가 있는 기술에 관심을 가졌고, AI 기술을 금융에 접목하는 연구를 한다.

이은조 (4장)
엔씨소프트 데이터 분석 및 엔지니어링 조직 실장. 전산학 및 보안학을 전공했으며, 지금은 머신러닝 및 통계 모델링 기반의 다양한 업무를 수행하고 있다.

박영호 (5장)
미시간대학교 스포츠경영학과 교수. 스포츠 마케팅학자이자 스포츠 소비자 및 경기력 데이터 분석가이며 양적 연구방법론, 스포츠 마케팅 분석 등에 대해 강의·연구한다.

노인우 (6장)
포털사이트 웹툰 서비스의 보안 개발자이자 데이터 과학자. 데이터 과학의 관점에서 보안을 다루는 연구를 주로 수행했고, 다양한 분야에 이를 접목하는 일을 하고 있다.

김범준 (7장)
신경과 의사이며 분당 서울대병원 신경과 부교수. 뇌경색 환자의 진료 과정에서 수집하는 임상 자료를 바탕으로 새로운 진단 및 치료를 고안하는 임상 연구를 하고 있다.

차현승 (8장)
카카오브레인 AI 개발자. 교육 스타트업에서 데이터 엔지니어로 일하며 더 나은 서비스를 제공하는 일을 했다. 모두가 최적화된 교육을 받는 인공지능 튜터에 관심이 많다.

이지혜 (9장)
존슨앤존슨 도쿄 지사 데이터 프로덕트의 기술 매니저. 한국과 일본의 여러 회사에서 일했다. 의료 및 심리학 업계에서 데이터 과학을 활용하는 활동에 관심이 많다.

김미애 (10장)
아마존 소프트웨어 엔지니어. 소프트웨어학과, 컴퓨터·IT학과에서 공부했으며, 지금은 딥러닝 기술을 기반으로 수요 예측을 하는 엔지니어링팀에서 일하고 있다.

김영민 (11장)
계량심리학 연구자, 텍사스공과대학교 박사과정. 석사과정에서 심리측정학을 전공했고, 한국생산성본부 연구원으로 일했다. 결측데이터 분석, 심리검사 개발 등을 연구한다.

저자소개

미 오하이오 주립대 계량심리학 박사. 대학에서는 양적 연구방법론을 연구하며 연구의 통계적 엄밀함과 재현성을 높이는 데 관심이 많았습니다. 업계로 오고 나서는 통계학과 기계학 방법론을 다양하게 응용하며 가치를 창출하는 일을 합니다.

_현) 미국 핀테크 회사 리서치 사이언티스트
_전) Lowe’s Home Improvement 데이터 과학자
_전) Amazon.com 응용 사이언티스트

저역서
_《가짜뉴스의 심리학》 저
_《데이터 과학자의 일》 저
_《3일 만에 끝내는 코딩 통계》 저

목차

들어가며



1장 통계학, 가장 오래된 데이터 과학

2장 인공지능, 머신러닝, 딥러닝의 차이는 무엇일까?

3장 핀테크와 테크핀이 경쟁하는 시대의 금융

4장 게임, 가장 풍부한 데이터가 뛰노는 세상

5장 야구에서 출루율이 중요해진 데이터 과학적 이유

6장 데이터 과학으로 서비스를 보호하는 방법

7장 병원, 의학 정보를 다루는 데이터 센터가 되다

8장 사람을 더 똑똑하게 만드는 인공지능 교육

9장 예비 데이터 과학자를 위한 취업 분투기

10장 머신러닝 서비스에 엔지니어가 필요한 이유

11장 공백 속에 숨은 놀라운 이야기, 결측데이터



한줄 서평