# 인공지능을 개발해 명인을 이기기까지
일본장기(쇼기) 아마 5급인 개발자 야마모토는 어느 날 장기 프로그램을 개발해보기로 한다. 그동안 장기 프로그램은 많이 나와 있었지만 그 실력이란 게 워낙 미천해서 인간과는 상대가 되지 않았기 때문이다. 아마 수준이지만, 꽤 높은 수준의 장기 실력을 갖춘 자신이라면 지금까지 나온 프로그램 중에 제일 나을 것이라고 생각했다. 야마모토가 장기 프로그램을 개발한다는 소문이 들자 다들 기대를 했고, 드디어 프로그램이 나왔다. 그러나 결과는 폭망!
야마모토가 말을 8개나 떼고 두었지만, 컴퓨터는 야마모토를 이기지 못했다. “그토록 격렬히 이기고 싶지 않은 적은 처음이었다”고 야마모토는 말했지만, 컴퓨터는 하수 중 가장 하수였다. 무엇이 문제였을까? 장기를 잘 두는 사람이 프로그램을 만들면 가장 장기를 잘 둘 줄 알았는데 결과는 참패였다.
야마모토는 자신의 실력을 컴퓨터에게 알려주는 대신 컴퓨터가 스스로 공부하도록 다시 프로그램을 짰다. 디지털화된 장기 기보를 컴퓨터가 보고 스스로 변수를 조절하도록 한 것이다. 즉 ‘기계학습’을 도입하자, 프로그램은 점점 승률이 올라가기 시작했다. 여기에 인간의 기보뿐 아니라, 컴퓨터끼리 대결해 도출한 데이터를 접목하는 ‘강화학습’까지 도입하자 프로그램은 인간의 수준을 넘어서기 시작한다. 그리고 드디어 일본에서 가장 장기를 잘 둔다는 명인과 대결하기까지 이른다. 결국 야마모토의 프로그램은 명인을 이긴다.
# 알파고 이후의 세계 그리고 흑마술
야마모토는 장기 프로그램의 성공 이후 호기롭게 바둑 프로그램에 도전하려 했다. 그런데 바둑에는 풀리지 않는 숙제가 있었다. 장기는 말과 말의 관계를 변수로 사용해서 컴퓨터를 ‘가르칠 수 있었다’. 예를 들어 왕에 높은 점수를 주고 졸(일본 장기에서는 보)에 낮은 점수를 주면 컴퓨터는 왕을 빼앗기지 않으려고 할 것이다. 그런데 바둑에는 그런 말 간의 관계가 없었다. 어떤 관계에 점수를 많이 주면 될까를 고민하고 있는데 ‘알파고’가 나타났다. 알파고는 일종의 신경망 컴퓨팅인 ‘딥러닝’을 이용해서 컴퓨터를 가르쳤다. 바둑판을 ‘보고’ 유리한 위치를 판단하기 시작한 것이다. 그리고 그 알파고는 최강 바둑 기사인 이세돌을 이겨버렸다.
야마모토는 바둑 프로그램을 만들 계획을 깨끗이 포기한다. 그리고 과연 인공지능이란 것이 어떤 방향으로 나아갈지를 고민했다. 이제 인공지능은 인간이 파악할 수 없는 수준으로까지 나아가고 있다. 실제 알파고나 야마모토의 프로그램이 두는 수의 의미를 인간이 알지 못한다. 분명히 효과는 있는데, 왜 그런지 알 수 없는 것이다. 계속 성능은 좋아지지만 인간이 이해할 수 없는 단계로 나아가고 있다. 이 상태로 계속 발전한다면 인공지능은 과연 인간을 지배할 것인가? 인공지능에게 도덕성을 기대할 수 있을 것인가?
그간의 노력과 전망을 야마모토는 한 권의 책으로 정리했다.
# 개발자가 알려주는 가장 쉬운 인공지능 이야기
이 책은 실제 인공지능 개발자가 쓴 것이지만, 본인이 인공지능에 대한 지식이 별로 없을 때부터 시작해서 결과를 이루었기 때문에, 아무 사전 지식이 없더라도 쉽게 이해할 수 있도록 구성돼 있다. 심지어 인공지능에 대한 기본 지식뿐 아니라 일본 장기를 모르더라도 쉽게 이해가 된다.
방송 매체에서 매번 기계학습이나 딥러닝이라는 이야기를 들었지만, 솔직히 그게 무엇을 의미하는지까지는 잘 알지 못했을 것이다. 딥러닝이라고 하면 ‘아주 깊숙이 배우는 것인가?’ 하고 지레짐작하는 게 고작이었을 것이다.
그런데 이 책을 읽고 나면 이해도가 월등히 높아졌음을 느낄 수 있다. 누군가 “딥러닝이 뭐야?”라고 물어보면 자신도 모르게 “그건 인간의 신경망을 모방한 컴퓨터 기술인데, 블라블라블라……” 하고 설명하고 있는 자신을 발견할 수 있을 것이다.
1985년생. 처음으로 프로 기사에게 승리한 현존 최강 쇼기 프로그램 ‘포난자’ 개발자. 주요 컴퓨터 쇼기 대회 4연패 중. 아이치가쿠인대학 특임준교수, 도쿄대학 첨단과학기술연구센터 객원연구원, HEROZ(주) 리드엔지니어. 본서가 첫 저서임.
들어가며 6
제1장 쇼기의 기계학습 - 프로그래머로부터 졸업하다 13
명인을 쓰러뜨릴 프로그램은 명인만이 짤 수 있을까? 15
애초에 컴퓨터란 게 뭘까? 19
쇼기 프로그램은 어떻게 짜나? 22
쇼기에서 말하는 탐색과 평가’ 28
평가 방식 구축하기 31
인공지능의 겨울 33
인간의 생각을 이해하는 건 포기했어 38
쇼기 AI가 체스 AI보다 20년 늦게 등장한 이유 43
인간을 이기기 어려운 이유, 경우의 수가 많아서? No! 44
컴퓨터에게 쇼기가 어려운 이유 47
컴퓨터에게 쇼기와 체스의 본질적 차이란? 49
컴퓨터 쇼기의 기계학습 53
기계학습의 약점과 이를 해결하기 위한 시도들 59
포난자의 성장 65
전왕전(電王戰) 68
프로그래머로부터 졸업하다 73
제2장 흑마술과 딥러닝 - 과학으로부터 졸업하다 77
기계학습이 초래한 ‘해석성’과 ‘성능’의 트레이드오프 79
흑마술이 되어가는 포난자 81
‘나태한 병렬화’라는 흑마술 83
딥러닝, 인공지능에 날개를 달다 87
딥러닝의 원리와 역사 90
딥러닝의 뼈대, ‘드롭아웃’이라는 흑마술 94
딥러닝, 어디까지 와 있나 98
딥러닝과 지능의 본질은 ‘이미지’? 103
환원주의적 과학으로부터 졸업하다 105
제3장 바둑과 강화학습 - 천재로부터 졸업하다 109
인공지능이 예상보다 훨씬 빨리 성장한 이유 111
인간은 ‘기하급수적 성장’을 직관적으로 이해할 수 없다 113
인류는 앞으로 프로 기사와 같은 경험을 하게 된다 116
포난자, ‘지켰노라, 깨뜨렸노라, 벗어났노라’ 118
강화학습이란? 121
탄생! 포난자 스타일 124
인류의 반격과 허용 128
알파고의 등장 132
컴퓨터에게 바둑이 유독 특별한 게임이었던 이유 134
몬테카를로 방식이라는 구세주 137
주사위에도 지능이 있다?! 141
몬테카를로 바둑의 성장 143
알파고가 보여준 사실, ‘바둑은 이미지’였다 144
알파고의 세 가지 무기 149
앙상블 효과 155
과학이 종교가 되는 순간 157
천재로부터 졸업하다 158
제4장 윤리관과 인공지능 - 인간으로부터 졸업하다 161
지능과 지성 163
‘중간 목적’과 PDCA로 싸우는 인간 기사 166
‘목적이 있다’는 것은 ‘의미와 이야기로 생각한다’는 것 172
인공지능, 딥러닝으로 지성을 획득하다 175
포난자 2045 178
인공지능은 인간의 윤리관과 가치관을 학습한다 181
특이점과 ‘좋은 사람’ 이론 184
마치며 190
권말부록 ’구글 인공지능 vs 인간’ 세기의 대결, 그 의미는? 197
인간을 뛰어넘은 알파고, 어떻게 강해졌나 199
이미지 인식의 정확성에서 인간을 뛰어넘은 컴퓨터 204
무작정 외우기? No! 추상화해서 생각한다 209
알파고는 수를 많이 읽는다? No! ‘감’이 기막히게 좋은 것이다 213
바둑 기사도 설명이 안 되는 한 판 219
컴퓨터라 막판에 강한 것이 아니다 224
세계 챔피언, “내 승률은 5퍼센트” 227
허를 찔리면 약해진다? 알파고 공략법을 파헤친다 231
컴퓨터를 혼란에 빠뜨린 묘수로 형세 역전 235
컴퓨터는 논리력이 부족해 240
잘 알려진 수순을 못 알아보는 알파고를 얕잡아보다 247
인류에게 남은 것은 언어와 논리, 알파고가 보여준 인공지능의 가능성이란? 253
우리가 하는 판단 대부분은 바둑보다 쉽다 257