다큐멘터리 '알파고' 그리고 인공 지능에 대한 생각들

Experience/2022's Experience

다큐멘터리 '알파고' 그리고 인공 지능에 대한 생각들

ikjo 2022. 8. 22. 18:29

알파고 vs 이세돌

2016년 3월 9일 오후 경, 대학생 3학년이었던 나는 "마이크로 컨트롤러"라는 전공 필수 강의를 들으며 Atmega128라는 마이크로 컨트롤러 유닛의 이론을 배우고 있는 중이었다. 수업 중에 때마침 친구로부터 어떤 알파고라는 AI(인공 지능)가 우리나라 대표 프로 바둑 기사 이세돌과 바둑으로 한 판 붙는다는 얘기를 전해들었다.

당시에는 바둑에 대해서도 잘 몰랐지만 인공 지능이라는 개념에 대해서도 생소했다. 하지만 그럼에도 불구하고 어떻게 컴퓨터가 사람을, 그것도 이세돌이라는 자타가 공인하는 프로 바둑 기사를 이길 수 있겠나라는 생각이 우선적으로 들었던 것 같다. 당시 나에게 있어 게임에서의 인공 지능이라고 해봤자 끽해야 스타크래프트에서 컴퓨터를 상대하는 그런 것에 불과했다.

그렇게 친구가 수업 중 몰래 경기를 보는 것을 힐끔힐끔 보며 수업을 듣던 중, 갑자기 이세돌이 졌다는 충격적인 얘기가 뉴스 속보에 나오는 것이었다. 하지만 첫 판은 실수닌까 그럴수도 있다고 생각했다. 하지만 다음 날에도 패배, 그 다음 날에도 패배.. 5전 3선승제였던 게임은 결국 알파고의 승리로 끝나게 되었다. 처음 이세돌이 당연히 이길 것이라고 생각했었던 나는 어느새 이세돌이 1승이라도 하길 바라고 있었다.

하지만 제 4 대국에서 이세돌은 기적적으로 승리를 거머쥐었고 당시 사람들 모두 "역시 이세돌이다"라는 찬사를 보냈었던 기억이 있다. 결과적으로 아쉽게도 제 5 대국에서는 이변이 일어나지 않았고 결국 게임은 4:1로 알파고의 승리로 끝나게 되었다.

나에게 이전 보다 특별한 의미를 갖는 '인공 지능'

IT 비전공였음에도 불구하고 당시 나는 알파고와 이세돌의 바둑 경기로 인공 지능에 대한 인식이 많이 바뀌었던 것 같다. 뭔가 인공 지능이라고 하면 먼 미래의 일이라고 생각했었지만, 현재 혹은 가까운 미래의 일이었고 인공 지능의 비약적인 기술 발전으로 인간의 능력을 압도할 수 있겠다는 생각이 들었다.

하지만 그러한 생각도 그때 그 순간으로 끝났고, 나는 다시 주어진 현실대로 나의 주전공(전기전자) 학습에 매진했고 그렇게 시간이 흘러 대학 졸업과 함께 에너지 업종 회사에 취업했다. 그리고 3년간의 직장 생활을 끝으로 현재는 개발 공부를 하고 있다.

당시 나에게 있어 알파고와 이세돌의 경기는 단순한 해프닝이었을 뿐이었지만, 개발 공부를 하고 있는 지금의 나에게 있어서는 뭔가 더욱 특별한 의미를 갖는 것 같다. 비록 현재 내가 준비하고 있는 것은 웹 개발이지만 인공 지능과 아에 동 떨어진 분야는 아니라고 생각한다.

인공지능과 웹(image source :https://medium.com/evincedev/how-artificial-intelligence-is-transforming-web-development-processes-49365fe27f8)

다큐멘터리 '알파고' (스포일러 포함)

그러던 중 우연히 '알파고'라는 미국 다큐멘터리를 알게 되었는데, 때마침 유튜브 딥마인드(Deep Mind) 채널에 해당 다큐멘터리가 공개되 있어 찾아 보게 되었다.

알파고와 이세돌 간의 바둑 대국 자체에 대해서는 대부분의 사람들이 잘 알고 있다. 하지만 해당 다큐멘터리는 일반인들에게 보이지 않았던 알파고와 이세돌 간의 대국 그 이면을 다룬 내용이다.

구글 딥마인드 CEO 데미스 하사비스

다큐멘터리의 시작은 구글 딥마인드 CEO인 데미스 하사비스의 이야기로 시작된다. 그는 어린 시절 각종 체스 대회에서 우승하는 등 체스를 굉장히 잘했다고 한다. 그랬던 그는 8살 때 체스 대회에서 우승해서 받은 돈으로 컴퓨터를 샀는데, 그때부터 컴퓨터는 사고를 확장시켜주는 도구라고 생각했다고 한다. (난 8살 때 포켓몬 스티커 모았...👀)

개인적으로 IT 분야에는 정말 많은 천재들이 존재한다고 생각하는데, 예상대로 데미스 하사비스 역시 천재 그 자체였다. 이 다큐를 보고 그가 어떤 사람인지 궁금해서 나무위키를 잠깐 살펴봤는데, 월드 와이드 웹의 개발자 '팀 버너스리'가 데미스 하사비스를 가리켜 '세계에서 가장 똑똑한 사람'이라고 말했을 정도라고 한다. 😅

그는 케임브리지 대학 컴퓨터 공학 학부생 시절 처음 바둑을 배웠는데, 체스 등의 여러 게임을 섭렵했던 것에 '비해서' 바둑은 진도가 느렸다고 한다. (체스 등에 비해 상대적으로 느렸다는 거지, 못하진 않았던 것 같다.) 그리하여 그는 인공지능을 통해 바둑을 정복하고자 했다고 하며 (아니 의식의 흐름이 이렇게..?! 😲) 학부 시절 친구였던 '데이비드 실버'와 함께 바둑 프로그램에 대해 이야기했다고 한다.

참고로 데이비드 실버 역시 본 다큐멘터리에 자주 등장한다. 이 분은 딥마인드의 리드 리서처로서 강화 학습(Reinforcement learning) 등을 전문으로 하시는데, '아자 황' 박사와 함께 알파고를 개발하는데 상당히 많은 기여를 하신 것으로 보인다.

끝이 안 보이는 바둑의 경우의 수 그리고 알파고의 등장

1997년 IBM의 체스 인공지능 프로그램인 딥 블루가 공식 경기에서 당시 체스 챔피언이었던 가리 카스파로프를 이겼다. 하지만 당시에 바둑이라는 게임은 컴퓨터에게 있어 커다란 장벽이었다. 바둑 판 전체에서의 경우의 수는 무려 '우주의 원자 개수'보다도 많다고 한다. 이는 전 세계의 컴퓨터를 이용해 백만년 동안 구동시켜도 변화도를 다 계산할 수 없는 수준이라고 한다.

하지만 그 이후로 컴퓨터는 성능과 기반 기술들이 비약적인 발전을 이루었고 인간의 두뇌 신경망을 모방한 '심층 신경망(Deep Convolutional Neural Network)'이라는 핵심 기술을 바탕으로 빅데이터를 처리함으로써 스스로 바둑 두는 법을 학습하는 이른바 '머신 러닝(Machine Learning, 기계 학습)'이 가능해졌다.

그리고 마침내 2015년 10월, 유럽 바둑 챔피언이었던 판 후이와 구글 딥마인드가 설계한 인공지능 바둑 프로그램인 알파고가 영국 런던에서 대국을 펼치는 날이 왔다. 판 후이는 알파고와의 대결에서 승리를 확신했었다. 하지만 판 후이의 기대와 달리 결과적으로 5:0으로 참패하고 말았다. 이는 역사상 최초로 프로 바둑 기사가 컴퓨터에게 진 순간이었다. 😭

하지만 당시 바둑계에서는 이를 두고 판 후이의 실력이 부족했다는 평가가 많았다. 이에 구글 딥마인드는 더 큰 도전이 필요했다. 그리고 이들이 선택한 다음 상대는 바로 대한민국의 대표 프로 바둑 기사 '이세돌'이었다.

하지만 딥마인드는 판후이와 대국을 펼쳤던 알파고로는 이세돌 같은 탑 바둑 기사를 상대하기에는 부족하다고 생각했었던 것 같다. 경기 이후에도 알파고의 알고리즘을 더욱 극한까지 밀어붙였고 판 후이의 도움을 받아 알파고의 약점을 분석해서 더욱 강화시켜나갔다.

알파고 너란 녀석.. 정체가 무엇이냐?

당시 AI알못이자 바둑알못이었던 나의 생각처럼 대다수의 바둑계 전문가들도 이세돌의 승리를 예상했다고 한다. 하지만 우리는 이미 결과를 알고 있다. 예상과 달리 이세돌은 1:4로 알파고에게 패배하고 말았다. 하지만 그 누구도 이세돌의 실력이 부족해서라고 평가하지 않는다. 알파고가 괴물 그 자체였기 때문이었다.

인공지능 바둑 프로그램인 알파고는 '정책망(Policy Network)'과 '가치망(Value Network)' 그리고 '트리 탐색(Tree Search)' 세 개의 주요 요소(component)로 구성된다고 한다.

우선 정책망에서 고수들의 경기를 모방하는 훈련을 한다고 한다. 이때 심층 신경망 기술을 이용하여 바둑판의 현재 국면을 인식하고 대국에서 유리한 착수 지점들을 찾아내는(예측하는)데, 이는 탐색 과정이 없는 행렬 연산을 하기에 매우 적은 시간이 소요된다고 한다.

이후 각각의 변화도들을 트리 형태로 만들고 가치망을 이용해서 특정 변화도에 대한 승률을 얻어내고 알파고는 현재 국면에서 가장 높은 승률의 수를 두는 것이라고 한다. 이처럼 알파고는 대국 중에 승률의 극대화를 모색할 뿐이지 상대를 몇집 차로 이길지에 대해서는 관심이 없다고 한다.

A typical policy network for a problem with discrete action space(image source : https://abhishm.github.io/Policy-Gradient-with-RNN/)

이때 주의할 점은 이러한 과정은 브루트 포스 알고리즘처럼 모든 경우의 수에 대해 승리를 보장하는 검증된 수를 두는 것이 아니라 학습된 데이터들을 통해 이길 확률이 가장 높은 수를 두는 것이라고 보는 게 맞다. 우주의 원소의 개수 보다도 많은 경우의 수를 일일이 검증할 수 없기 때문에 일종의 차선책으로 나온 것이라고 볼 수 있을 것 같다.

졌잘싸..! 이세돌!!

알파고는 이미 판후이와 대결 전부터 앞선 과정들로 아마추어 고단자들의 바둑 기보 10만개를 인터넷으로 입력받아 해당 기보를 모방하고 여러 버전의 알파고들과 수백만 판의 대국을 통해 강화 학습이 이루어진 상태였다. 판 후이와의 대결 이후로 정확히 어떤 학습을 추가적으로 거쳤는지는 공개되진 않았지만, 판 후이의 자문과 함께 더욱 강력한 강화 학습을 거쳤으리라 생각이 된다. (아마 이세돌이 알파고와 바둑을 두면서 고뇌했었던 것만큼 개발자들도 고뇌했으리라...🤣)

즉, 이세돌은 눈으로 보이지는 않지만 셀 수 없이 많은 기보들과 홀로 고독한 싸움을 했었던 것이다. 당시의 알파고는 저 수많은 기보 데이터들을 처리하기 위해 48개의 TPU(Tensor Processing Units)를 사용했다는데, Google I/O 2016에서 소개된 1.0 버전 기준 TPU는 뉴럴 네트워크 연산에 대해 당시의 최신 CPU 및 GPU 보다 15~30배 빠르며, 전성비*는 30~80배 향상된 것이라고 한다.

*전성비 : 일정 전력당 얼마만큼의 연산을 하는가에 대한 상대적 지표

Tensor Processing Units in a data center(image source: https://www.datacenterdynamics.com/en/news/google-unveils-second-generation-tpu-available-as-a-service/)

이쯤되니 나는 알파고의 경이로운 데이터 분석 및 처리 능력 보다 이러한 알파고를 한 번이라도 이긴 이세돌에 대한 경이로움이 생겼다. 이세돌이 이긴 대국은 제 4대국으로 당시 이세돌이 78번째 수를 두자 알파고는 이후에 이상한 수를 두기 시작했다. 당시 현장에 있던 딥마인드 개발자의 말에 따르면 알파고가 이러한 실수를 했을 때 95수까지 탐색을 했다고 한다. 이는 총 대국에서 가장 깊은 탐색을 했었던 것으로, 너무 깊은 탐색을 하다가 스스로 길을 잃은 것으로 판단했다.

사실 이미 알파고는 엄청난 자가 학습을 거친 상태로 딥마인드 개발자들 역시 알파고의 의중을 정확히 판단하는 게 불가능한 상태였다. 단지 승률이 가장 높은 수를 두는 프로그램일 뿐이라고 믿는 것일 뿐이었다. 하지만 개발자들은 분명히 유리한 형국을 이어가고있었던 알파고가 이세돌의 78번째 수로 깜짝놀랐다는 것을 확신했다. 이후에 점점 알파고의 승률은 급격히 감소하기 시작했고 알파고는 항복(?) 팝업 메시지를 띄우고야 말았다.

알파고는 실수하지 않았다. 엄청난 기보를 바탕으로 승률이 가장 높은 수를 두고있었을 뿐이다. 단지 알파고가 네트워킹을 통해 입력받은 수많은 기보와 서로 다른 버전의 알파고들과의 강화 학습을 통해 얻어낸 수많은 기보 상에 없었던 수를 이세돌이 그 순간에 생각해내 둔 것이다. 당시 중국 바둑의 전설 구리 9단은 이세돌이 두었던 78번째 수를 두고 '신의 한수'였다고 했을 정도이다.

현장에 있던 딥마인드 개발자들은 알파고가 그 상황에서 이세돌의 그 수를 둔다고 시뮬레이션했을 때 확률이 0.007%에 불과한 것으로 확인했다. 이는 만분의 일의 확률로 딥마인드 개발자들 역시 이건 이세돌의 신의 한수이자 이세돌은 가히 위대한 바둑의 대가였다고 인정할 수밖에 없었다.

이후에 알파고의 행보?

본 다큐멘터리에서는 이세돌과의 경기까지의 내용을 다루며 이후에 알파고의 행보에 대해서는 따로 다루진 않았다. 개인적으로 알파고의 근황이 궁금하여 나름대로 찾아보았다. 👀

알파고는 이세돌과의 경기 이후 중국 텐센트에서 서비스하는 한큐 바둑에서 잠시 활동했었는데, 이때 한중일 정상급 바둑 기사들과 상대하면서도 60연승을 거두었다고 한다. 또한 당시 세계 랭킹 1위 커제와도 공식적으로 3번기를 두었는데, 3전 전승을 거두었다.

사실상 알파고는 또 다른 알파고가 아니고서야 당해낼 수가 없는 경지에 온 것이다. 알파고의 비공식 대국을 포함한 총 전적은 74전 73승 1패로 이세돌에게 진 것이 유일하다. 이후 시간이 흘러 알파고에 대한 개발은 중단되었고 지금은 다른 인공 지능 개발 자원으로 활용되고 있다고 한다. (알파고 스타크래프트에는 관심 없니? 👀)

다큐 말미에 데이비드 실버에 따르면 알파고 연구에 대한 꿈은 데미스 하사비스와 함께 20년 전부터 꿈꾸던 일이라고 한다. 그들이 알고자 했었던 것은 '신경망이 바둑을 둘 수 있는가'였다고 한다. 결론적으로 그들의 꿈은 이루어졌다고 볼 수 있을 것 같다.

다큐멘터리가 시사하는 바

알파고는 이세돌과의 대결에서 프로 바둑 기사들도 이해할 수 없는 수를 두곤했다. 심지어 현장에 있던 딥마인드 개발자들 역시 "알파고에 오류가 발생한건가?"라는 의심을 가질 수밖에 없었다. (이세돌 역시 이 수를 이해하지 못했으리라...💦) 하지만 결과적으로 그 수는 승리로 이어지는 수였다. 알파고는 인간에게 더 나은 선택지를 제시한 것이었다. 이세돌 역시 알파고의 수를 보고 바둑에 아름다움을 이끌어 내는 굉장히 창의적인 수였다고 했으며, "바둑에서 창의성이란 무엇인가?"라는 의문을 느끼게 되었다고 한다.

본 다큐멘터리는 우리에게 여러가지 생각을 가지게 한다. 우선 인공 지능이란 것이 단순히 먼 미래의 얘기가 아니라 현재 또는 가까운 미래에 있다는 것이며 알파고는 그러한 사실을 우리들에게 입증해주었다.

또한 인간의 선택이 최선이 아닐 수도 있다는 생각을 가지게 했다고 본다. 알파고와의 경기 전만 하더라도 대다수의 사람들은 이세돌의 승리를 예상했다. 하지만 알파고는 보란듯이 자신이 두는 수가 승리에 더욱 가깝다는 사실을 보여주곤 했다.

마지막으로 우리는 인공 지능을 어떻게 바라봐야할지를 생각하게 한다. 다큐 말미에 저널리스트 캐드 매즈는 카스파로프의 말을 인용한다. "좋은 인간과 기계가 함께하면 최고의 조합이다.(Good Human plus Machine is Best Combination.)" 이는 우리가 인공 지능과 어떻게 공존해나가야 할 지에 대한 생각을 가지게 한다.

인공 지능에 대한 여러가지 생각들

벌써 알파고와 이세돌의 경기 이후로 무려 6년 5개월이라는 시간이 흘렀다. 분명 이 긴 시간동안 AI라는 기술은 더욱 비약적인 발전을 이루었을 것이라는 생각이 든다. 알파고와 이세돌의 경기 더 나아가 인공 지능이라는 기술은 분명 IT 산업의 종사자들 뿐만 아니라 산업 전방위에 영향을 미쳤으리라 생각이 든다.

현재 우리가 사용하는 인터넷 체계는 웹 2.0이라고 한다. 이는 단순히 정보를 사용자에게 제공하기만 하는 웹 1.0과 달리 사용자와 웹 서비스간 상호작용이 일어나는 형태로 지금의 '플랫폼 중심 생태계'를 만들었다고 볼 수 있다. 앞으로는 웹 3.0의 시대가 올 것이라는 주장도 있다. AI, 블록체인 등의 기술들이 웹과 결합되어 탈중앙형(초개인화된) 웹 생태계가 형성된다는 것이다.

Web 1.0 2.0 3.0(image source : https://researchhubs.com/post/computing/web-application/web-1-2-and-3.html)

혹자는 AI로 인해 기존의 수많은 일자리들이 대체될 거라 우려를 표한다. 또 다른 시선에서는 오히려 AI를 통해 파생되는 일자리가 더 많아질 것이라고도 한다. 또한 인공지능 의인화(강인공지능)에 대한 우려도 있다. 사회는 이에 대해 인공지능 개발자들에게 윤리와 책임성을 요구하고 있다. 우리는 늘 그렇듯이 한 번도 가보지 않은 길을 가고 있기에 그 과정에서 여러 갈등들이 있을 것이고 또한 절충해나갈 것이다.

더욱 거시적인 차원에서는 앞으로 AI 기술이 국가 경쟁력이라고 보는 시선도 있다. 현 정부에서도 이러한 시선에 공감하는지 AI를 비롯한 4차산업혁명 기술 인재양성 계획을 내놓고 있다. 이러한 4차산업혁명 기술은 우리나라 여야가 같은 기조를 유지하고 있는 정책 중 하나이기도 하다.

2021년 8월 11일 OpeanAI는 자연어의 코드 변환 인공지능 시스템인 CodeX를 공개했다. GPT-3에 깃허브 등의 웹 페이지 상 오픈 소스 코드를 학습시켜 개발된 프로그램으로 파이썬, 자바, 스위프트 등 여러 프로그래밍 언어에 적용이 가능하다고 하며, 앞으로의 발전 귀추가 주목된다. 개발자들 사이에서는 인공지능이 프로그래밍을 얼마나 대체할지, 또한 그 시점이 언제가 될지에 대한 여러 갑론을박이 있는 것 같다.

이 외에도 인공 지능은 우리 일상에서 흔히 사용되는 자연어를 처리하는 스피커(또는 비서 앱)와 이미지 식별 그리고 날씨, 주가, 분자의 움직임 등 미래 예측을 넘어서 군사(인공지능 전투기 등) 분야와 가상 인간을 활용한 홍보 등 마케팅 산업 그리고 게임, 작곡, 소설 집필 등의 문화예술 분야까지 산업 전방위적으로 확대되고 있다. (여담으로 SNS 상에서는 인공지능 기반 인간 이미지 합성 기술인 딥페이크가 자주 보이는 것 같다.)

본 다큐멘터리 중 스탠포드 대학 인공지능 연구소 디렉터인 '페이-페이 리'는 현재의 인공지능 기술은 초창기 수준에 불과하다고 한다. 하지만 IT 산업의 기술 발전 속도는 굉장히 빠르며 그 기술들이 갖는 잠재 가치는 무궁무진하다. 실제로 당시 AI가 바둑을 정복하는데 수십년이 걸린다는 게 중론이었다고 한다. 스마트폰이 처음 나왔을 당시 지금 현재의 모바일 생태계를 예상한 사람들이 얼마나 있었을까? 인공지능 또한 어느순간 우리 일상을 꿰차고 지금보다 더욱 활성화된 인공지능 생태계를 이루고 있을지도 모른다.

지금까지 인공 지능에 대한 언급만 했지만 인공 지능을 비롯한 블록체인, 메타버스 등 4차산업혁명과 관련된 거대한 기술들이 있고 이에 파생되는 크고 작은 기술(Value Chain, 밸류 체인)들이 많다. 이들은 타 산업간의 융복합을 통해 시너지 효과를 낼 수 있는 잠재력도 가지고 있다. 이처럼 4차산업혁명 과도기 시대에 살고있는 한 명의 사람으로서 앞으로 어떤 방향으로 성장해나가야할 지, 또한 어떻게 학습 해나가야할지 많은 생각을 하게 한다.

참고자료

https://www.youtube.com/watch?v=WXuK6gekU1Y

저작자표시 비영리 변경금지

'Experience > 2022's Experience' 카테고리의 다른 글

개발자로서의 기초를 다질 수 있었던 2022년에 대한 회고 (15)	2023.01.15
15주차간의 온라인 자바 기초 스터디를 마치며... (2)	2022.11.07
코드스쿼드 2022 마스터즈 코스(Java 웹 백엔드) 회고 (24)	2022.07.02

현재글다큐멘터리 '알파고' 그리고 인공 지능에 대한 생각들

꾸준히 합니다.

자바, wil, BOJ, Weekly I learned, Transaction, 접근지시자, 코드스쿼드, 애노테이션, 개발자, 마스터즈 코스, Weelky I iearned, 프로그래머스, ssafy, jvm, 회고, java, 성장, 백준, Spring, MYSQL,

Today :
Yesterday :

Ikjo's Technology blog