섹션

커제9단에 맞서는 알파고 어떻게 진화했나? '셀프대국 무한반복'

알파고가 스스로와의 대국을 통해 더욱 강화된 것으로 나타났다. 또한 지난해 이세돌 9단과 겨룬 인공지능 성능에 비해 더욱 발전한 것으로 전해졌다.

알파고 개발사인 구글 딥마인드의 데미스 허사비스 최고경영자(CEO)는 24일 중국 저장(浙江)성 우전(烏鎭) 인터넷 국제컨벤션센터에서 열린 '인공지능의 미래 포럼'에 참석, 알파고의 강화 과정을 설명했다.

허사비스 CEO는 "3년전 알파고 개발에 나설 때 바둑을 두는 전략게임으로 설계했지만 궁극적으로는 알파고를 통해 인공지능을 범용할 가능성을 염두에 뒀다"며 이에 따라 스스로 학습을 할 수 있는 시스템을 만드는 것에 그 초점이 맞춰졌다고 설명했다.

전날 알파고와 커제(柯潔) 9단의 첫 대국에서 알파고가 압도적 기량을 선보인 데 대해 알파고가 인간의 기보를 참고한 '지도 학습'보다는 스스로 바둑을 두며 최적의 전략을 깨달아가는 '강화학습'에 집중한 것을 그 배경으로 봤다.

작년 3월 이세돌 9단과 겨뤘던 인공지능은 '알파고 이세돌'이고 올해 초 프로기사들과 60연승을 거두고 커제 9단과 맞서고 있는 인공지능은 '알파고 마스터' 버전으로 이름 지어 졌다.

데이빗 실버 딥마인드 리서치 사이언티스트 겸 선임프로그래머는 알파고의 훈련 과정을 구체적으로 설명하면서 커제 9단과 맞서고 있는 알파고 마스터 버전은 알파고 이세돌 버전에 3점의 핸디캡을 줘도 될 정도로 강력하게 진화했다고 밝혔다.

한편 바둑에서 3점 차는 골프에서 프로선수와 보기 플레이어의 실력 차이와 비교할 수 있을 정도의 큰 기량 차이라고 김성용 9단은 설명했다.