На это достижение у ученых ушло более двух лет.
В январе 2017 года стало известно, что компьютерная программа Libratus обыграла четырех профессиональных игроков в покер и выиграла два миллиона долларов.
Однак ее создатели решили не останавливаться на достигнутом и сейчас представили миру новую версию программы — Pluribus, которая уже обыграла в техасский холдем сразу пятерых чемпионов в этой игре, «сидя» с ними всеми за одним столом, прямо как в традиционных казино. О разработке ученых пишет журнал Science.
Как рассказал Ной Браун (Noam Brown) из Университета Карнеги-Меллона в Питтсбурге (США), один из создателей Pluribus, искусственный интеллект, вырабатывая свою стратегию, создал несколько инновационных приемов, которые могут в дальнейшем повлиять на игру профессионалов по покеру.
Авторы Pluribus оснастили его «абстрактным действием» и «абстрактной информацией» — так программа смогла отбросить лишние варианты дальнейших ходов и оставить лишь те, которые потребуются для принятия решения. Во время тестов Pluribus, используя метод самообучения и систему «минимизации сожалений» (когда программа максимально сокращает разницу между уже принятым решением и оптимальной стратегией), сражалась в покер с пятью своими копиями, поначалу играя наугад. Впоследствии ИИ научился анализировать ходы и понял, какие действия и с какой вероятностью ведут к победе в игре.
Главная часть эксперимента проходила на протяжении 12 дней в два этапа: один игрок против пяти копий Pluribus либо пять профессионалов против ИИ.
Ежедневно в игре участвовали пять разных чемпионов по покеру, каждый из которых в прошлом выиграл более миллиона долларов. В итоге с помощью своей уникальной и в чем-то «парадоксальной» стратегии ИИ более чем за десять тысяч раздач обыграл всех лучших игроков и заработал полмиллиона долларов.
«Главный плюс Pluribus — способность совмещать разные стратегии. Это то, к чему идут профессиональные игроки в покер. Мало у кого получается менять тактику случайным образом и оставаться в плюсе. Почти все люди не справляются с такой задачей», — рассказал рекордсмен World Poker Tour Даррен Элиас (Darren Elias), который также потерпел поражение в игре с ИИ.