이세돌 9단 vs 알파고…바둑 기보 연습량에서도 비교 불가

입력 2016-03-12 01:59

URL공유
카카오톡

페이스북
X(트위터)

작게보기
기본크기
크게보기

▲인공지능 바둑 프로그램 알파고를 개발한 구글 딥마인드의 창업자 겸 CEO 데미스 허사비스가 11일 오후 한국과학기술원(KAIST)에서 특별 강연을 하고 있다.(사진=뉴시스)

이세돌 9단과 알파고는 바둑의 기보를 익히고 상대 또는 특정 바둑의 '수'를 익히는 분량에서도 큰 차이를 보이는 것으로 알려졌다.

알파고는 프로기사의 기보 16만개를 5주 만에 학습이 가능하다.

인공지능 바둑프로그램 ‘알파고’를 개발한 구글 딥마인드의 공동창업자 겸 최고경영자(CEO)인 데미스 허사비스가 11일 알파고의 학습능력을 공개했다.

허사비스 CEO는 이날 한국과학기술원(KAIST)에서 열린 ‘바이오 및 뇌공학과 특별세미나’에 참석해 “바둑은 인류가 고안한 가장 복잡한 게임으로 직관과 계산이 필요하고, 이를 마스터하는 데에는 패턴인식과 계획 능력도 결합해야 한다”며 “바둑은 인공지능에 훌륭한 도전 과제”라고 말했다.

바둑은 경우의 수가 너무 많아 누가 승자가 될 지 파악하는데 한계가 있어 기계가 넘을 수 없는 벽이라고 인식했다.

그러나 이세돌 9단이 패하면서 세계를 경악케했다.

허사비스는 “바둑은 탐색 공간이 매우 넓고 누가 승자가 될지 판단하는 평가함수를 만드는 게 거의 불가능해 컴퓨터가 하기에는 어려운 게임”이라고 알렸다.

이어 “알파고가 바둑을 학습하는 데에는 다음 수를 예측해 이길 수만을 고려하도록 탐색 폭을 줄이는 정책망(policy network)과 돌을 놓았을 때 승자를 예측하는 가치망(value network)이 이용됐다”며 “알파고의 학습능력은 컴퓨터와의 대국과 유럽 챔피언 판후이 2단과의 대국에서 입증됐다”고 밝혔다.

그는 우주의 원자 수보다 많은 경우의 수를 가진 바둑을 이해하는 인공지능을 만들기 위해 ‘딥러닝’을 개발하고 이를 활용했다. 딥러닝은 스스로 학습하는 인공지능을 말한다. 이에 따라 알파고는 추가적인 프로세스를 거칠수록 능력이 향상된다.

알파고는 프로기사의 기보 16만개를 5주 만에 학습이 가능하다. 사람이 하루에 3개의 기보를 모두 익히고, 이 과정을 1년 동안 지속하면 1000개의 경우의 수를 익힐 수 있다. 인간이 평생 학습할 수 없는 수의 공부량이다.

이후 자기 학습을 통해 프로기사의 관점으로 바둑의 탐색 범위를 줄여나가기 시작한 알파고는 지난해 10월 유럽챔피언을 꺾고, 5개월 후 지난 9일부터 이틀간 세계 최강 이세돌 9단을 상대로 2승을 챙겼다.

▲이세돌 9단 vs 알파고 5번기 2국 기보. (출처=알파고, 그래픽=연합뉴스)