세기의 대결이라는 바둑 대국이 끝났습니다. 그깟 바둑돌놀이라고 볼 수도 있는 이 게임이 그렇게나 주목을 받은 것은 인간 대 인간의 게임이 아니라 인간 대 컴퓨터의 게임이라는 점이었겠죠. 그 덕분에 바둑을 잘 몰랐던 저도 게임을 유심히 지켜봤습니다. 그렇게 좀 보다보니 이제는 바둑을 약간은 좀 이해할만도 하겠더군요.
알파고도 바둑을 그렇게 배웠다고 합니다. 어떤 규칙이나 이런 것을 입력한 게 아니라 여러 프로기사들이 바둑을 두는 기보를 그냥 보여줬다고 하더라구요. 그렇게 수많은 데이터를 그저 바라보는 것 만으로 그것을 학습해서 자기가 본 수만 두는게 아니라 보지 않은 수를 둔다는 점이 우리가 알고있던 기존의 컴퓨터 프로그램하고 가장 차이가 많이 나는 점입니다.
이미 많은 사람이 알고있다시피 이 게임은 4 대 1로 알파고의 승리로 끝났습니다. 그러나 이 알파고에 대해서 알면 알수록 이세돌 9단이 1판이라도 이긴게 정말 대단한게 아닌가 싶은 생각이 듭니다. 이 알파고는 흔히 알려졌다 시피 정책망과 가치망으로 이루어져 있습니다. 정책망은 바둑의 규칙을 이해하고 있어서 바둑판의 형세를 보고 바둑을 둘만한 여러가지 후보군들을 정해놓고 그 후보군들 중에서 가치망이 승률을 계산해서 돌을 착수하는 형태로 이루어져 있습니다.
가치망은 자기가 경험했던 수만번의 자체대국과 기타 다른 사람들과의 대국을 통해서 어떤 수를 선택했을때 가장 승률이 높은 가를 계산해두고 있는데요, 여기서 중요한 것은 이것들이 하나의 슈퍼컴퓨터에서 이루어지는 것이 아니라 엄청난 수의 병렬로 이루어진 CPU들과 GPU들을 통해서 가치망이 선택할만한 후보군이 만들어진다는 것입니다. 그러니까 이것은 알파고라는 시스템 안에 수없이 병렬로 연결된 CPU가 각자 자기가 생각하는 최고의 수를 가치망에게 건의를 하고 가치망은 자기가 여러가지 형태로 얻은 데이터를 통해 계산을 하고 그것으로 수를 결정한다 이렇게 볼 수 있는 거죠. 그 말은 알파고는 한 개별적인 단위가 아니라 하나의 팀을 이루고 있다 이렇게 보는게 맞을 겁니다.
그러면 대국중에 이루어진 맥락과는 다소 동떨어진 이른바 '떡수'라고 불리는 것들도 이해가 됩니다. 한 사람이 두는게 아니라 한 팀이 서로 의논해서 두는 것이니 당연히 맥락과는 동떨어진 그런 수들도 나올 수가 있는 것이지요. 그런면에서 그 수많은 정책망에서 건의하지 못했던 제 4국에서의 78수를 둔 이세돌은 그야말로 인간의 위대한 한방을 보여줬다고 말할 수 있는 겁니다.
딥마인드는 궁극적으로 일반인공지능을 만드는게 목적입니다. 바둑을 통해서 그 점을 어느정도 이루었으니 이제 스타크래프트를 도전하겠다는 말이 나옵니다. (실제로 할지 안할지는 차치하고서라도...) 스타크래프트는 실시간으로 이루어지는 게임인지라 바둑과는 비교했을때 인공지능이 더 발전해야 이루어질 수 있는 점이 분명히 있을 겁니다.
바둑계는 알파고 충격을 통해서 여러가지 패러다임이 바뀔 수 있다고 봅니다. 알파고와의 대국을 앞으로도 지속적으로 진행하여서 인간이 알파고를 극복하고 그러면서 또 바둑계가 한단계 성장하는 그런 계기가 되었으면 좋겠네요.
결론은 하나입니다. 세돌이형! 진짜 너무너무 잘했어요!!!!