[사이언스] 알파고 뛰어넘는 'AI 코페르니쿠스'가 나타났다!

[비즈한국] 지난 11월 7일 영화 ‘신의 한 수: 귀수편’이 개봉했다. 5년 전 개봉했던 ‘신의 한 수: 사활편’의 스핀오프에 해당하는 작품으로 전편에서 맥거핀처럼 가볍게 언급만 되고 지나갔던 의문의 캐릭터 ‘귀수’의 이야기를 다루고 있다.

영화 속에서는 다양한 스타일로 자신만의 바둑을 두는 고수들이 등장한다. 색이 구분되지 않는 투명한 바둑돌만 가지고 일색 바둑을 두기도 하고, 아예 눈을 감고 바둑판조차 보지 않고 오직 머릿속으로만 두는 맹기 바둑을 수련하기도 한다. 혹시 이 영화에 웹툰 원작이 있지 않을까 궁금하게 만들 정도로 만화 같은 설정은 유치해 보이면서도 관객을 몰입하게 만드는 매력을 갖고 있다.

2016년 3월 10일 열린 이세돌 9단과 알파고의 제2국. 인공지능은 모두의 예상을 깨고 인간을 압도적으로 차이로 이겼다. 사진=한국기원 제공

그런데 많은 관객들은 리뷰에서 영화에는 나오지 않지만 현실 속 ‘진짜 귀수’라고 볼 수 있는 인공지능 프로그램 알파고를 소환한다. 그러면서 영화에 등장하는 만화 같은 설정의 초능력 아닌 초능력을 발휘하는 등장인물들을 어이없다는 듯이 비웃고 있을 알파고를 상상한다.

#더 진보한 알파고

사실 이세돌 9단과의 대국이 진행되기 전까지 이세돌 선수 본인을 포함해 많은 사람들은 이세돌의 승리를 확신했다. 수천 년간 이어져온 가장 오래된 보드게임이라 불리는 바둑판에서 바둑돌이 만들어내는 경우의 수는 너무나 많다. 인생의 슬픔과 고뇌가 고스란히 담겨 있다고 이야기되는 바둑은 당연히 프로그램 따위가 넘볼 수 없다는 인식이 퍼져 있었다.

하지만 결과는 달랐다. 4국에서의 놀라운 신의 한수로 기권한 경기를 제외하고 알파고는 이세돌 선수를 압도했다. 1국에서부터 알파고는 경기를 중계하던 모든 바둑 전문가 역시 당황스럽게 만들 정도의 충격적인 플레이를 보여주었다. 직접 승부를 벌이던 이세돌 선수조차 알파고의 충격적인 플레이에 입을 벌릴 정도였다.

알파고 제로가 바둑돌을 놓을 위치를 고민하는 과정을 보여주는 모식도. 매순간 바둑돌을 놓을 수 있는 가능한 상황 Q 값에서 다음 상황이 벌어질 수 있는 확률 P 값에 따라 변화하는 신뢰도의 상한치 U를 계산해 더해준다. 각 가능한 상황에서 다음에 또 벌어질 경우의 신뢰도를 동일한 방법으로 계산해 반복한다. 이와 같은 전체 계산이 한 번 끝나고 나면 각 위치에 바둑돌을 두었을 때의 전체 승률 π 값을 얻을 수 있다.

하지만 그 사이 이미 이세돌과 승부를 겨뤘던 알파고 리(AlphaGo Lee) 버전은 더욱 성장했다. 대국이 펼쳐지기 바로 전날까지만 해도 다들 이세돌 선수의 승리를 확신했지만, 하루 사이에 사람들은 프로그램을 ‘알사범’이라 부르며 칭송하기 시작했다. 불과 몇 년 사이에 모두가 얕잡아보던 인공지능은, 이제 영화에 나오는 만화 같은 술수를 부리는 캐릭터들조차 헛짓거리를 하는 것처럼 보이게 만들 정도로 무서운 존재가 되어버렸다.

#‘신의 경지’에 이르는 데 인간의 데이터는 필요없었다

이세돌, 커제와의 승부를 거치면서 알파고는 더 많은 학습 데이터를 확보했다. 현재 연구진은 더욱 개발된 버전인 알파고 제로(AlphaGo Zero)를 완성했다. 더욱 놀랍게도 알파고 제로는 인간의 기보 데이터가 필요하지 않다. 기본적인 바둑 규칙만 배우고 나면 혼자 알아서 자기 자신과 바둑을 두며 전략을 학습해나간다.

알파고 제로는 혼자서 0.4초 안에 바둑돌을 빠르게 두어야 하는 초스피드 속기 바둑을 490만 판 가까이 두었다. 그 결과 알파고 제로는 이세돌을 무너뜨렸던 알파고 리(AlphaGo Lee)의 실력을 압도하는 기력을 불과 72시간 만에 얻었다. 알파고 리는 새로운 버전인 알파고 제로와의 경기에서 백전백패라는 처참한 승부의 쓴맛을 봤다.

비로소 완성된 알파고 제로의 기력을 비교한 그래프. 스스로 익힌 바둑의 규칙에 따라 최적의 전략을 깨우치는 강화학습(Reinforcement learning)과 기존의 지도학습(Supervised learning)으로 훈련한 인공지능의 기력이 시간에 따라 성장하는 변화가 각각 파란색 실선과 보라색 실선으로 나타나있다. 첫 번째 a 그래프에서 파란 점선은 이세돌 선수를 이겼던 이전 버전인 알파고 리의 기력을 나타낸다.

말 그대로 알파고 제로는 이제 자기 자신 말고는 이 세상에 적수가 없는 정말 ‘신의 경지’에 오른 셈이다. 게다가 어떤 인간의 기보에서도 찾을 수 없는 이상한 수를 두었다. 처음에는 당황스러운 알파고의 착수를 보며 실수나 버그라며 비웃기도 했다. 그러나 결국 경기가 다 끝나고 돌아보면 그 수는 ‘악수’가 아닌 미래를 내다본 최고의 ‘신의 한 수’였다.

알파고 제로는 인간이 지난 수 세기 동안 쌓아온 기보 데이터를 쓰지 않는다. 다시 말해 바둑의 신의 경지에 오르는 데 인간의 기보는 하나도 쓸모가 없었다.[1]

#바둑에 이어 스타크래프트까지, 다음은?

그렇다면 이제 바둑을 은퇴한 알파고는 또 무엇에 도전하고 있을까? 최근 구글 딥마인드(Google DeepMind)의 연구진은 바둑보다 더 복잡하고 다양한 변수가 있는 게임 ‘스타크래프트’를 플레이하는 인공지능 ‘알파스타(AlphaStar)’를 개발하고 있다.

고전적인 오락 ‘벽돌깨기’를 하는 구글 딥마인드의 인공지능. 프로그램에게는 아래 작대기로 구슬을 떨어지지 않도록 조절해 벽돌을 깨뜨려야 한다는 기본적인 규칙만 알려주었다. 처음에는 플레이를 잘 못하고 헤매지만, 마지막에는 위에 난 틈 속으로 구슬을 집어넣어 천장에 부딪히면서 한꺼번에 여러 개의 벽돌을 깨부수는 아주 ‘인간적인’ 전략을 익히는 것을 볼 수 있다.

바둑은 경우의 수가 무궁무진하지만 어쨌든 제한된 바둑판 안에서 단 두 가지의 바둑돌로 칸을 채워가는 게임이다. 오히려 게임이 진행될수록 바둑돌을 둘 수 있는 빈 칸이 사라지기 때문에 변수가 줄어드는 측면이 있다.

하지만 스타크래프트는 실시간으로 상대방이 어떤 유닛을 얼마나 만들어서 어디에 배치하는지에 따라 승률이 계속 변화하는 더 복잡한 게임이다. 그래서 구글 딥마인드는 인공지능을 더 복잡하고 유기적인 실제 인간의 삶에 대입시키기 위한 중간 연습 과정으로, 스타크래프트가 가장 적합하다고 생각했다.

인공지능 알파스타가 게임의 최선의 전략을 파악하는 과정을 보여주는 모식도. 알파스타는 실시간으로 각 유닛의 종류와 움직임을 확인하고 그것을 수치화한다. 알파고와 마찬가지로 알파스타도 강화학습과 지도학습 두 가지 방식으로 훈련을 받았다. 유닛을 움직일 때마다 기존의 경기 리플레이 영상 데이터와 상황을 비교해 판단하거나, 완전히 학습한 게임 규칙을 바탕으로 전체 전략을 결정해 플레이를 진행한다.

이미 지난 1월 알파스타는 유럽의 프로게이머들과 경기를 펼쳤다. 당시 알파스타는 훈련의 효율을 위해 테란, 프로토스, 저그 세 가지 종족 중에서 프로토스 한 종족만 가지고 연습했다. 여러 프로 선수들의 플레이 기록을 바탕으로 알파스타는 거의 2000년 동안 쉬지 않고 게임을 하는 훈련량을 버텨냈다.[2]

유럽 선수들과의 경기 결과는 어땠을까? 이번에도 게임이 진행되기 전에는 다들 인간의 승리를 내다보는 사람들이 많았지만, 결과는 그렇지 않았다. 알파스타는 총 11번의 경기에서 10번을 승리했다. 거의 전승이라고 봐도 되는 엄청난 결과였다. 물론 아직 세계 제일이라고 하는 우리나라 선수들과의 대전이 남아 있지만, 과연 더욱 성장해서 나타날 다음 버전의 알파스타를 쉽게 제압할 수 있을까?

구글 딥마인드의 알파스타가 인간 프로게이머와 벌였던 스타크래프트 2 경기 영상. 시간이 많을 때 한 번 프로리그를 보는 마음으로 관람해보자.

#알파고의 진짜 꿈은 천문학자

그렇다면 알파고의 진짜 꿈은 무엇일까? 알파고는 단순히 바둑을 두기 위해서, 스타크래프트를 플레이하기 위한 목적으로 개발된 것이 아니다. 이렇게 익힌 스스로 학습하는 딥러닝 기술을 바탕으로, 궁극적으로 인류가 직면한 다양하고 복잡한 문제의 가장 최적의 답을 제시하는 역할을 하기 위해 계속 개발되고 있다.

놀라운 속도로 성장하는 인공지능을 보면서 일부 사람들은 ‘그래 봤자, 인간이 만든 바둑이라는 게임 규칙 안에서 연산을 빠르고 정확하게 할 뿐이지, 바둑과 같은 세상에 없던 새로운 게임 자체를 창조하는 것은 인공지능이 할 수 없다’ 라며 위안을 삼기도 한다.

하지만 그 마지막 위안마저 이제 확신할 수 없다. 어쩌면 더욱 성장한 다음 세대의 알파고는 인간 과학자가 발견하지 못한 새로운 물리 법칙을 먼저 발견할지도 모른다. 이제 알파고는 인공지능 천문학자가 되기 위한 훈련을 시작했다.

수천 년 전부터 인간은 태양과 화성의 움직임을 보고 지구를 중심에 둔 잘못된 우주관을 먼저 떠올렸다. 가끔씩 지구의 하늘에서 화성이 반대 방향으로 이동하는 역행(Retrograde)을 보이지만 그 역시 지구를 중심에서 그대로 유지한 채 해결했다. 지구는 그대로 태양계의 중심에 둔 채, 화성 궤도에 또 다른 작은 기하학적 보조 장치인 주전원(Epicycle)을 추가하는 방식이었다.

2011년 10월(오른쪽 위)에서 2012년 7월(왼쪽 아래)에 이르는 화성의 겉보기 움직임을 담은 사진. 만약 지구를 중심으로 화성이 그 주변을 공전하고 있다면 지구의 하늘에서 화성은 단순히 한 방향으로만 움직이는 것으로 보여야 한다. 하지만 실제 화성은 중간에 반대 방향으로 역행하는 모습을 보인다. 이미지=Cenk E. Tezel, Tunç Tezel(TWAN)

과거 고대의 천문학자들은 지구를 태양계의 중심에 둔 채 화성의 역행을 설명하기 위해, 실제로는 화성이 지구를 중심으로 하는 큰 원 위에서 또 움직이는 작은 원에서 함께 움직이며 복잡한 움직임을 보인다고 생각했다. 영상은 고대의 천문학자들이 주전원을 추가해 설명했던 화성의 겉보기 움직임을 보여준다.

새로운 훈련을 시작한 인공지능 사이넷(SciNet)은 지구에서 본 태양과 화성의 겉보기 움직임의 데이터를 학습했다. 그리고 태양계가 어떻게 작동하는지를 유추했다. 그 결과 지구가 아닌 태양을 중심에 두는 태양계 모델이 가장 자연스럽다는 것을 스스로 깨달았다! 또 태양에서 거리가 멀어질수록 태양에 의한 중력이 거리의 제곱에 반비례해서 약해지는 방식으로 태양과 행성 사이의 인력이 작용한다는 만유인력 법칙과 운동량 보존 법칙을 추론했다. 인공지능 사이넷은 정말 인간 천문학자처럼 밤하늘 천체의 움직임을 보고 가장 그럴듯한 우주 모델을 상상하고, 수학적인 물리 법칙을 찾아냈다! 말 그대로 ‘AI 코페르니쿠스’가 된 셈이다.[3]

인간은 태양계의 진짜 중심이 지구가 아닌 태양이라는 사실을 깨닫기까지 수천 년이 걸렸지만, 이번 인공지능은 그 놀라운 발견을 훨씬 빠른 속도로 순식간에 끝내버렸다. 인류의 과학사에서 가장 위대한 도약으로 전해지는, 태양계의 중심이 지구에서 태양으로 바뀐 ‘코페르니쿠스 혁명’이라는 그 엄청난 패러다임의 전환이 이 인공지능 프로그램 속에서 아무렇지도 않다는 듯이 튀어나와 버린 것이다.

인공지능 사이넷은 배경 별에 대한 상대적인 움직임을 비교해 태양과 화성, 그리고 지구의 역학적 관계를 파악했다. 매순간 화성과 태양의 겉보기 움직임을 통해 지구에 대한 두 천체의 상대적 위치를 파악하고, 이 천체들이 실제 우주 공간에서 어떻게 움직이고 있는지를 분석했다. 그 결과 지구가 아닌 태양을 태양계 중심에 두는 것이 가장 적합하다는 결론을 내렸다.

#인공지능도 노벨상을 탈 수 있을까?

이번 프로그램 사이넷의 놀라운 결과를 통해 이제 인공지능은 단순히 바둑과 스타크래프트와 같은 틀이 정해진 게임 밖, 훨씬 복잡한 진짜 세상의 문제에도 답을 제시할 수 있다는 것을 확인했다. 게다가 수천 년간 이어진 천문학자들의 토론의 역사가 민망해질 정도로, 실제 우리 태양계가 어떻게 작동하는지의 원리를 순식간에 찾아버렸다.[4]

이런 방식으로 인공지능 과학자, 인공지능 천문학자를 훈련시킬 수 있다면, 어쩌면 더욱 발전될 다음 버전의 프로그램은 여전히 우리가 해결하지 못하는 다양한 난제를 해결할 답을 제시할 수 있을지 모른다.

실제로 이번 사이넷을 개발한 연구진들은 이제 훨씬 더 복잡한 양자역학의 데이터를 입력해, 아인슈타인의 E=mc^2이라는 유명한 법칙을 깨우칠 수 있을지를 테스트할 계획이다. 나아가 여전히 해결하지 못하고 있는 양자역학 분야의 다양한 실험 결과와 우주에서 관측되는 우주배경복사 등 여러 데이터를 입력해 사이넷이 어떤 답을 내놓을지를 테스트할 계획이다.[5]

지난 2018년 11월 화성 표면에 성공적으로 착륙한 인사이트(Insight) 탐사선은 화성의 미세한 지진파를 감지하고 땅 속 탐사를 준비하고 있다. 영상은 탐사선이 화성에서 보낸 첫 16일간의 기록이다. 스스로 주변 지형지물을 파악하고 탐사 계획을 짜서, 화성의 토양과 지질 구조를 연구하는 인사이트 탐사선은 초보적인 수준의 인공지능 지질학자라고 볼 수 있다. 어쩌면 우리는 더 발전한 인공지능 물리학자, 인공지능 천문학자도 만나게 될지 모른다. 영상=NASA

어쩌면 정말 가까운 미래, 다음 버전의 차세대 사이넷은 우리가 찾지 못했던 새로운 방정식으로 기술되는 양자역학의 세계와 우주의 진화를 보여줄지 모른다. 만약 우리가 미처 생각지 못한 새롭고 당황스러운 답을 던져준다면, 과연 우리는 그것을 프로그램의 ‘악수’로 생각하고 웃어넘길 수 있을까? 아니면 인간은 절대 찾을 수 없었던 가장 최적의 ‘신의 한 수’로 받아들이고 새로운 과학의 패러다임을 받아들여야 할까?

만약 인공지능이 정말 새로운 법칙을 발견하고, 그것이 새로운 다음 시대의 과학 혁명을 야기한다면, 우리는 역사상 처음으로 인간이 아닌 프로그램이 새롭게 그려낸 과학적 패러다임 속을 살아가는 첫 세대가 될 것이다. 놀랍게도 우리는 그러한 미래를 머지않아 마주하게 될지 모른다. 알파고는 처음부터 바둑판 너머 우주를 바라보고 있었다.

[1] https://www.nature.com/articles/nature24270

[2] https://www.nature.com/articles/s41586-019-1724-z

[3] https://www.nature.com/articles/d41586-019-03332-7?fbclid=IwAR3xs1brzZdhmJt0s3wVbSJP02I-5RIV8bu5uFPDbkMcsiZk3onm6mDa7IQ%E2%80%AC&sfns=mo#ref-CR1

[4] https://www.nature.com/articles/d41586-018-06749-8

[5] https://journals.aps.org/prl/accepted/9e07eY09T2e1fd7f88ae46166090ef41fa6ad4c34

필자 지웅배는? 고양이와 우주를 사랑한다. 어린 시절 ‘은하철도 999’를 보고 우주의 아름다움을 알리겠다는 꿈을 갖게 되었다. 현재 연세대학교 은하진화연구센터 및 근우주론연구실에서 은하들의 상호작용을 통한 진화를 연구하며, 강연과 집필 등 다양한 과학 커뮤니케이션 활동을 하고 있다. ‘썸 타는 천문대’, ‘하루 종일 우주 생각’, ‘별, 빛의 과학’ 등의 책을 썼다.

지웅배 과학칼럼니스트

galaxy.wb.zi@gmail.com

[핫클릭]

· [사이언스] '별 먼지' 인류는 초신성 폭발을 볼 수 있을까
· [사이언스] 우주배경복사에서 찾은 '태초'의 흔적
· [사이언스] 허블 상수, 중력 상수는 '상수'가 아니었어?!
· [사이언스] 우주가 행성을 만드는 법 '행성 레시피'
· [사이언스] 우리 은하는 살찌고 있다!