ИИ от Google очень плохо справляется с игрой в покемонов, неоднократно «паникуя» и затрачивая более 800 часов для победы над Элитной Четвёркой.

Напоминает необычный ностальгический момент на платформе ПК в играх для консолей, давайте вернемся к тому сложному моменту в игре Pokémon, когда ваше сердце бьется учащенно и руки потеют от страха при виде уменьшающейся шкалы здоровья вашего пойманного спутника. Удивительно, что персонаж Джемини проявляет похожее беспокойство, когда отряд его покемонов близок к поражению.

В недавнем отчёте я был взволнован услышать похвалу от Google DeepMind в адрес семейства моделей 2.X, особенно выделяя интересный пример — канал Twitch Gemini_Playes_Pokemon, автором которого является инженер Джоэл Чжан, не имеющий непосредственной связи с Google. Во время двух различных прохождений игры Pokémon Blue, когда каждый раз я выбирал Squirtle своим стартовым покемоном, произошло явление, которое они назвали ‘Agent Panic’ в своём приложении.

Проще говоря, когда агент AI (конкретно Gemini 2.5 Pro) попадает в сложную ситуацию с низким здоровьем или очками энергии, он сталкивается со сложностями при выполнении задач и принятии решений. Это становится заметным по его неспособности эффективно использовать определенные инструменты во время игры, пока сохраняется данное состояние.

Поскольку ИИ-агенту пришлось заниматься вымышленным предметом чая, присутствующим только в ремейке игры Pokémon Blue из 90-х годов и отсутствующим в оригинальной версии этой игры, потребовалось около 813 часов, чтобы завершить игру впервые. Впоследствии после корректировок Чжань время прохождения сократилось до общего количества 406,5 часа.

В молодые годы я провёл много времени, погрузившись в эти игры, переигрывая их снова и снова, что вызывало у меня ощущение их необъятности. Однако важно отметить, что по данным How Long to Beat основную сюжетную линию Pokémon Blue можно пройти примерно за 26 часов. Поэтому не совсем точно утверждать, что я мастерски играю в видеоигру более чем двадцатипятилетней давности, созданную для детей.

Хотя я нахожу интригующие диаграммы рассеяния в этом отчете, детально описывающие значительный прогресс AI по сравнению с Элитной Четверкой захватывающими, есть и другие аспекты проекта, которые меня не вдохновляют. Например, использование ИИ-агентов для игры в видеоигры с целью измерения их способностей кажется бессмысленным и вызывает чувство экзистенциального беспокойства — какой смысл, когда машина может просто поглотить и воспроизвести это? Также стоит отметить, что эти так называемые ‘бенчмарки AI’ не дают много ценной информации (однако TechCrunch проводит глубокий анализ этой темы).

Термин «Агент Паника» относится к усилиям сделать ИИ более похожим на человека путем его изображения как испытывающего тревогу. Это становится особенно заметным в играх, которые нравятся детям. Важно подчеркнуть, что агенты искусственного интеллекта не испытывают эмоции, такие как паника, и их действия могут казаться поспешными только потому, что Gemini имитирует паттерны из своих обучающих данных.

Как геймер, мне смешно наблюдать за попытками ИИ разобраться в любимой игре, но это не значит, что все должны быть чрезмерно восторженны и аплодировать Гемини как домашнему животному.

Лучшие игровые ПК: топовые готовые сборки. Лучшие игровые ноутбуки: отличные устройства для мобильного гейминга.

Смотрите также

2025-06-18 18:19