Искусственный интеллект обыграл чемпиона Европы по го

В официальном блоге компании Google сообщается, что разработанная специалистами этой компании программа нанесла поражение действующему чемпиону Европы по игре в го. Это первая победа искусственного интеллекта над игроком такого высокого уровня.



Создание эффективного алгоритма для го оказалось более сложной задачей, чем разработка шахматной программы, так как число возможных позиций в игре значительно больше. Простой просмотр всех возможных вариантов развития позиции не принесет успеха, поэтому сейчас разработчики систем искусственного интеллекта создают игровых роботов на основе искусственных нейронных сетей, способных обучаться при анализе сыгранных партий. Недавно мы рассказывали об одной такой разработке – системе Darkfores2, сочетающий поиск вариантов на локальном уровне с обучаемой нейронной сетью, которая анализирует позицию глобально. Система AlphaGo, разработанная в компании Google, также сочетает обучаемую нейронную сеть с поисковым алгоритмом. Данные в ней обрабатываются с помощью 12 сетевых слоев, объединяющих миллионы «нейронов». Одна из сетей занята определением следующего хода, другая предсказывает победителя игры. AlphaGo прошла обучение, проанализировав 30 миллионов ходов в партиях, сыгранных людьми, и научилась правильно предсказывать следующий ход человека в 57 % случаев.

Так как разработчики хотели, чтобы AlphaGo играла не как люди, а лучше их, они заставили систему сыграть еще тысячи партий саму с собой, корректируя стратегию при помощи метода, известного как обучение с подкреплением. В качестве вычислительной базы для AlphaGo использовалась Google Cloud Platform.

После этого создатели AlphaGo перешли к практическим испытаниям. Сначала программа сыграла с лучшими имеющимися на данный момент программами для игры в го и выиграла 499 партий из 500. Затем для матча с AlphaGo был приглашен Фань Хуй – один из лучших современных игроков в го, обладатель второго профессионального дана, чемпион Европы 2014 и 2015 годов. Матч состоялся в октябре в лондонском офисе Google, и AlphaGo выиграла все пять партий.

Подробности о своей системе разработчики AlphaGo рассказали в статье, которую опубликовал журнал Nature. На сайте Nature опубликованы также отклики экспертов на победу AlphaGo. Сам Фань Хуй прокомментировал свое поражение так: «Проиграть было очень тяжело. До игры с AlphaGo, я думал, что я должен выиграть. После первой игры я изменил свою стратегию и боролся больше, но все равно проиграл. Проблема в том, люди иногда делают очень большие ошибки в силу своей человеческой природы. Иногда мы устаем, иногда мы очень хотим выиграть игру, и это на нас давит. Программа не такая. Она очень сильная и стабильная, как стена. Для меня это большая разница. Я знаю, что AlphaGo это компьютер, но если бы никто не сказал мне, возможно, я счел бы, что это немного странный, но очень сильный игрок, настоящий человек. Конечно, когда я проиграл, я не был счастлив, но все профессионалы проигрывают много игр. Так что я проигрываю, я учусь играть, и, возможно, меняю свою игру. Думаю, это хорошая вещь на будущее».

В марте 2016 года в Сеуле состоится матч, где соперником AlphaGo станет Ли Седоль – лучший, по мнению многих экспертов, игрок последнего десятилетия, обладатель девятого профессионального дана, признававшийся сильнейшим игроком мира в 2008 и 2010 – 2012 годах.

Источник: http://polit.ru/news/2016/01/28/ps_alphago

Коментарі