강화학습 무장 알파고에 ‘바둑 황제’도 ‘무릎’
강화학습 무장 알파고에 ‘바둑 황제’도 ‘무릎’
  • By 정세진 (info@koreaittimes.com)
  • 승인 2017.05.24 10:03
  • 댓글 0
이 기사를 공유합니다

사진/ JTBC 캡처

구글이 개발한 인공지능(AI) 바둑프로그램 알파고가 지난 23일 세계 바둑 랭킹 1위인 중국의 커제 9단을 꺾었다. 이날 커제 9단은 중국 저잔성 우전 인터넷 국제컨벤션센터에서 열린 알파고와의 대국에서 한집 반으로 패배했다.

커제 9단이 패배하자 AI 전문가들은 대부분 “예측했던 결과”라는 반응을 보였다. 다만 대국 내내 알파고가 망설임 없이 수를 두었고, 이세돌 9단과의 대국 당시 같은 실수가 없었던 점 등을 들어 그 동안 진화의 과정을 거쳤음을 말해준다. 이세돌 9단이 거둔 1승이 인간이 알파고를 이긴 마지막 승리가 될 것이라는 말이 나온다.

2015년 판후이 2단과의 대국에서 승리한 ‘알파고 v.(버전) 13’은 아마추어 기보에 의존한 딥러닝 방식이었다면 이세돌 9단을 꺾은 ‘알파고 v.18’은 아시아 최고수들의 기보를 학습하는 방식을 택했다.

커제와의 대국에 나선 ‘알파고2.0’은 알파고 v.18끼리의 대결을 반복하며 기보를 완성하는 ‘강화학습’을 연마한 것으로 알려졌다. 인간의 기보를 따라하지 않고 독자적인 기술을 개발했다는 의미이다.

강화학습은 인간이 돌발적인 상황에서 직관을 발휘하는 사고 과정을 흉내낸 알고리즘을 이용, 목적 달성에 최적화된 방식을 수없이 고려한 후 시행착오를 거쳐 체화하는 방식이다.

즉 사람처럼 끊임없는 반복 학습을 통해 스스로의 약점을 찾아내고 시정하는 과정을 거쳤다는 것이다. 의외의 실수가 없었던 이유는 이 때문으로 풀이된다.

하드웨어 부분에서도 지난해 대국에서 구글이 고안해 낸 AI용 칩인 T텐터프로세서유닛(TPU) 2세대가 활용된 것으로 추측되고 있다.

만약 TPU 2세대가 적용된 것이라면 연산 속도가 몇 십 배 이상 빨라졌을 것이라는 게 IT 전문가들의 의견이다. 지난해 이세돌 9단을 꺾은 알파고를 보며 일각에서는 기계가 인간을 능가할 것이라는 이른바 ‘AI 공포증’이 생겨나기도 했으나, 이번 승부를 보는 시각은 조금 달라진 모습이다.

오히려 AI의 활용 가능성에 대한 기대감이 높아지고 있는 것이다. 업계 관계자들은 “알파고에 사용된 학습 방식을 에너지 절약 및 의료 진단, 헬스케어 등 다양한 분야에 활용할 수 있을 것”이라고 말한다.

알파고와 대국을 치른 커제 9단 역시 “현재로서는 알파고의 약점이 보이지 않는다”며 “졌지만, 화는 나지 않는다”고 언급했다.

 

 

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • ABOUT
  • CONTACT US
  • SIGN UP MEMBERSHIP
  • RSS
  • 2-D 678, National Assembly-daero, 36-gil, Yeongdeungpo-gu, Seoul, Korea (Postal code: 07257)
  • URL: www.koreaittimes.com | Editorial Div: 82-2-578- 0434 / 82-10-2442-9446 | North America Dept: 070-7008-0005 | Email: info@koreaittimes.com
  • Publisher and Editor in Chief: Monica Younsoo Chung | Chief Editorial Writer: Hyoung Joong Kim | Editor: Yeon Jin Jung
  • Juvenile Protection Manager: Choul Woong Yeon
  • Masthead: Korea IT Times. Copyright(C) Korea IT Times, All rights reserved.
ND소프트