『예측 분석이다』는 논픽션 어워드 2014 금상 수상작이도 한 이 책은 예측 사회를 살아가는 리더들이 꼭 알아야 할 의사결정 나무, 휴리스틱, 네트워크 분석, 앙상블 기법, 텍스트 분석, 예측 최적화 등의 키워드를 선진 기업들의 실제 적용 사례를 통해 생생하게 소개한다.
저자 :
저자 : 에릭 시겔
저자 에릭 시겔(Eric Sigel) 박사는 데이터 마이닝 및 데이터 분석 분야에서 이름을 떨치고 있는 전문가이다. 1997~2001년에 컬럼비아 대학에서 대학원생들에게 기계 학습, 텍스트 마이닝, 데이터 시각화 등의 분야를 가르쳤다. 뉴욕 시에 소재한 고객 프로파일링 및 데이터 마이닝 소프트웨어 회사 2개를 공동 창업하였으며, 2003년에 예측 분석 서비스를 제공하는 ‘Prediction Impact’라는 회사를 창업해 포춘 100대 기업들을 대상으로 전략 및 마케팅을 위한 데이터 분석 서비스를 제공하고 있다. 에릭은 데이터 마이닝을 이용해 컴퓨터 보안, 사기 감지, 언어학 및 정보검색 분야에서 다양한 문제들을 해결해 왔다. 현재 데이터 마이닝을 주제로 하는 ‘Predictive Analytics World’와 ‘Text Analytics World’라는 연례 콘퍼런스의 공동설립자이자 의장으로서 양대 콘퍼런스를 주관하고 있으며, ‘Predictive Analytics Times’라는 인터넷 매체를 운영하고 있다.
에릭이 저술한 이 책(Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die)은 2014년 미국 논픽션 작가 협회로부터 ‘Nonfiction Book Award’ 금상을 수상하였다.
역자 : 고한석
역자 고한석은 오바마의 재선 당시 빅데이터 활용 선거 전략을 입체적으로 읽을 수 있는 《《빅데이터 승리의 과학》》의 저자이기도 하다. 그는 현재 IT에 기반을 둔 사회혁신과 데이터 마이닝에 관심을 가지고 집필과 강연 활동을 하고 있다. 서울대 중문과를 졸업하고, 하버드대학 케네디 정책대학원에서 IT 정책으로 석사학위를 받았다. 그후 SK China의 IT/인터넷 사업개발팀장으로 중국 베이징에서 4년 동안 일했고 이후 삼성네트웍스의 글로벌사업추진팀장으로 5개 해외사무소를 총괄하는 역할을 하기도 했다. 또 젊은 시절 가졌던 꿈인 사회변화에 기여하는 삶을 살고자 정당의 정책연구원에서 정책기획 연구원으로 활동했으며, 정세분석국장으로 여론조사 데이터를 관리하기도 했다.
- 옮긴이의 말 ㆍ 데이터 과학이라는 새로운 분야의 등장
- 서언 ㆍ 큰 힘에는 큰 책임이 따른다
- 머리말 ㆍ 이제 비즈니스의 규칙이 새로 쓰여진다
00 예측 분석의 매혹과 위험성
대기업과 예측: 자산의 미래 | 천리안을 가진 컴퓨터를 소개합니다 | “나에게 먹이를 주세요.” 컴퓨터는 데이터를 먹고 자란다 | 나는 당신이 그럴 줄 알았다 | 예측의 잠재력과 한계 | 꿈의 구장 | 예측은 비즈니스를 최적화한다 | 폐인들의 힘: 데이터 과학자 | 학습의 예술
01 예측이 주는 소리 없는 혁명
- 데이터 과학의 성과가 비즈니스의 판을 급격히 바꾸고 있다
예측 사회의 시작 | 누구나 예측 분석의 가치를 비용으로 환산할 수 있다 | 2분 후를 미리 볼 수 있는 사람이 할 수 있는 일 | 백만 달러짜리 소리 없는 혁명 | 개인별 맞춤화의 위험 | 오늘도 내일도 의미 있는 예측이 되려면? | 누가 클릭할지 알고 나니 매출이 껑충! | 예측 모델은 어떻게 만들어지는가 | 행동에 옮기는 것이 진정한 경쟁력 | 위험한 도전! 주식시장의 블랙박스 거래 시스템의 오류를 찾아라 | 지상관제탑 나와라! 문제가 생겼다, 오버! | 작은 모델이 할 수 있는 것들 | 지상관제탑 나와라! 이륙에 성공했다, 오버! | 존 엘더, 예측 분석 서비스 회사를 차리다 | 인간의 내면에 대한 예측
02 힘이 커질수록 책임도 커진다
- 휴렛팩커드, 쇼핑몰, 경찰은 당신의 비밀을 추론해 낸다
타깃의 예측과 예측의 타깃 | 여론몰이의 도화선이 된 프레젠테이션 | 기업이 그녀의 임신을 알아냈다! 후폭풍 | 쇼핑몰의 고객 예측, 사생활 침해 논란에 휩싸이다 | 순간이동할 수 있는 사물을 가둘 수는 없다 | 법과 질서: 정책, 정치, 규제 | 데이터를 둘러싼 전투 | 데이터 마이닝은 파헤치지 않는다 | HP, 누가 퇴사할 것인지 알아내는 예측 모델을 개발하다 | 빛과 그림자, 전 직원에게 ‘이직 위험’ 점수를 매기다 | 데이터 분석적 인사관리 | 통찰력: 퇴사에 영향을 주는 요소들 | 민감한 데이터 분석 보고서 다루기 | 남보다 앞서 나간 상태에서 그만두지 마라 | 범죄를 예측하여 사전에 예방한다 | 사기범 찾아내기 | 범죄 데이터와 데이터 범죄 | 측정되지 않은 컴퓨터 리스크 | 편견의 악순환과 판도라의 상자 | 좋은 예측, 나쁜 예측 | 힘의 원천
03 데이터 효과
- 대중의 집단 정서와 경기 변동의 관계
감정에 대한 데이터와 데이터에 대한 감정 | 블로그 게시물의 분위기 예측하기 | 불안 지수 | 사람들의 집단적 정서를 시각화하기 | 사람들의 기분이 좋을 때 당신의 돈을 투자하라 | 사람들의 기분과 주가의 관계 | 데이터 쓰레기 더미에서 보물을 찾아라 | 할 수 있는 모든 것을 계측화하라 | 데이터가 몰려온다! T.M.I. | 빅데이터의 ‘속도’에 주목하라 | 데이터는 언제나 우리에게 말을 건넨다 | 예측을 위한 변수들 | 예측 분석이 발견한 이상하고 놀라운 인간 행동들 | 상관관계가 인과관계를 의미하지는 않는다 | 감정의 원인과 결과 | 한 장의 그림이 주는 힘 | 대중의 기분과 경기 변동을 최초로 예측 | 우연한 발견을 마주치는 법 | 블로그 연구를 통해 투자를 고려하는 게 문제일까? | 돈이 세상을 움직인다 | 모든 것을 한 군데로 모으기
04 학습하는 기계 - 부동산 담보대출 리스크에 대한 체이스 은행의 예측 분석
데이터 과학자, 은행을 만나다 | 은행, 리스크에 직면하다 | 예측, 리스크와 싸우다 | 사업은 곧 리스크다 | 학습하는 기계 | 학습하는 기계 만들기 | 실패한 경험으로부터 학습하기 | 기계 학습은 어떻게 이루어지는가 | 의사결정 나무는 어떻게 만들어지는가 | 컴퓨터여, 너 자신을 프로그램하라 | 데이터를 통해 배우고 또 배운다 | 더 큰 것이 더 좋은 것이다 | 과잉학습: 너무나 많은 가정 | 귀납법의 수수께끼 | 기계 학습의 예술과 과학 | 기계가 제대로 학습되었는지 검증하려면 | 예술작품을 조각하듯 섬세하게 조정하라 | 의사결정 나무를 체이스 은행 업무에 적용하기 | 나무에서 돈이 자란다 | 예측 분석은 왜 글로벌 금융위기를 막지 못했나 | 더 우수한 성능을 위하여
05 앙상블 효과
- 넷플릭스, 크라우스소싱, 그리고 협력으로 예측 분석력 향상시키기
아마추어들, 데이터 분석 과학자 되다 | 데이터 분석도 통계학도 몰랐던 다크호스 | 마인드소싱: 다양성 속에 존재하는 성공 | 크라우드소싱이 날개를 달다 | 경쟁자와 공유하고 협력하면 이긴다 | 적과 연합하여 경쟁하라 | 메타 학습 | 이길 수 없다면 하나가 되어라 | 기계도 ‘집단 지성’을 발휘한다 | 예측 모델들의 대중적 지혜 | 예측 모델들을 담은 자루 | 실전에 투입된 앙상블 모델 | 일반화의 역설: 더 많다고 좋은 것은 아니다 | 예측의 힘, 한계는 없다
06 인간을 이긴 기계 학습
-컴퓨터 왓슨, 《제퍼디!》에서 어떻게 이겼나