NitroGen: Концептуальная иллюстрация универсального ИИ-мозга, играющего в 1000+ игр разных жанров с помощью геймпада.

NitroGen: 1000 игр, один ИИ и мощь NVIDIA — будущее гейминга наступило

NitroGen — новая модель искусственного интеллекта от NVIDIA, способная играть в более чем 1000 видеоигр, обучаясь исключительно на видеозаписях геймплея. Корпорация представила открытую фундаментальную модель, которая анализирует кадры игрового процесса и генерирует команды геймпада в реальном времени, демонстрируя прорыв в области воплощённого ИИ и робототехники.

Niархитектура и принцип работы нового игрового ИИ

Модель NitroGen представляет собой унифицированную систему «зрение-действие», обученную на 40 000 часов публично доступных видеозаписей игрового процесса, охватывающих более 1000 различных игр. В отличие от традиционных игровых ботов, ограниченных одной конкретной игрой, NitroGen использует технологию поведенческого клонирования для освоения универсальных игровых навыков.

Архитектура модели включает два ключевых компонента. Vision Transformer (SigLip2) обрабатывает входящие RGB-кадры размером 256×256 пикселей. Затем диффузионный трансформер (DiT) генерирует последовательности действий для геймпада, включая положение джойстиков и состояние кнопок. Общее количество параметров модели составляет около 493 миллионов.

NitroGen от NVIDIA: Сравнение показателей точности модели (R2 score и accuracy) при извлечении действий из видео геймплея для разных типов контроллеров.
Статистика точности распознавания команд в проекте NitroGen. > Данные подтверждают высокую корреляцию между видеопотоком и командами геймпада. Визуализация подготовлена командой NVIDIA Research в рамках исследования фундаментальных игровых моделей. Правообладатель: © NVIDIA Corporation. Изображение взято с официального сайта проекта: nitrogen.minedojo.org

Имитационное обучение: как NitroGen учится играть

Ключевая инновация проекта NitroGen заключается в методе сбора обучающих данных. Исследователи использовали видеозаписи стримеров с YouTube и Twitch, на которых отображается оверлей геймпада в реальном времени. Специально разработанный алгоритм автоматически распознаёт положение контроллера на экране и извлекает действия игрока покадрово.

Материал по теме:  Искусственный интеллект в сельском хозяйстве: возможности для фермеров
Процесс формирования датасета NitroGen. На видео показано, как алгоритм NVIDIA извлекает действия игрока из публичных стримов: система одновременно анализирует игровой процесс и состояние оверлея геймпада (нажатия кнопок и движение стиков). Именно на таких данных модель обучалась 40 000 часов. Источник: NVIDIA Research / nitrogen.minedojo.org

Для локализации геймпада применяется сопоставление ключевых точек с использованием алгоритмов SIFT и XFeat. Обученная модель сегментации восстанавливает положение джойстиков и состояние кнопок с точностью корреляции 0,84 R² для джойстиков и 0,96 для кнопок. Область оверлея маскируется в обучающих кадрах, чтобы модель не могла «подсматривать» действия напрямую.

Универсальность NitroGen: от платформеров до RPG

Набор обучающих данных NitroGen охватывает широкий спектр игровых жанров. Action-RPG составляют 34,9% от общего объёма данных, платформеры — 18,4%, экшн-приключения — 9,2%. Оставшийся объём распределён между гонками, roguelike, 2D и 3D играми различных типов.

При тестировании на ранее невиданных играх модель NitroGen продемонстрировала улучшение показателя успешности выполнения задач до 52% по сравнению с моделями, обученными с нуля. Это свидетельствует о способности системы переносить приобретённые навыки между различными игровыми вселенными с разной физикой и механиками.

NitroGen и робототехника: связь с проектом GR00T

Архитектура NitroGen основана на модели GR00T N1.5, изначально разработанной NVIDIA для управления гуманоидными роботами. По словам Джима Фана, директора по робототехнике NVIDIA, исследователи обнаружили, что архитектура робототехнического управления успешно переносится на игровые задачи с минимальными модификациями.

Это открытие имеет фундаментальное значение для развития воплощённого ИИ. Видеоигры предоставляют идеальную тестовую среду: визуально насыщенные миры с разнообразными задачами, охватывающими широкий спектр сложности и временных горизонтов. Освоение универсального игрового управления приближает создание агентов, способных действовать в реальном физическом мире.

Практические применения технологии NitroGen

NVIDIA позиционирует NitroGen как исследовательский проект, однако потенциальные применения выходят далеко за рамки лаборатории. Разработчики игр могут использовать модель для автоматизированного тестирования сборок и обнаружения багов. Исследователи ИИ получают открытую платформу для изучения обобщённого воплощённого интеллекта.

Создатели контента могут генерировать демонстрационные прохождения без участия человека. Для людей с ограниченными возможностями технология открывает новые способы взаимодействия с играми. Все компоненты проекта — веса модели, датасет и код — опубликованы в открытом доступе на Hugging Face.

Материал по теме:  Человекоподобные роботы: почему Родни Брукс считает их тупиком

Ограничения и перспективы развития NitroGen

Текущая версия NitroGen оптимизирована для игр с управлением геймпадом и менее эффективна для жанров, требующих мыши и клавиатуры — стратегий в реальном времени и MOBA. Модель фокусируется на быстрых моторных реакциях («геймерском инстинкте»), а не на долгосрочном стратегическом планировании.

NVIDIA рассматривает NitroGen как первый шаг к созданию универсальных воплощённых агентов, способных действовать в произвольных физических и виртуальных мирах. Долгосрочная цель — системы, для которых управление роботом станет столь же естественным, как управление игровым персонажем.


Вам также может быть интересно:

Источники:

Что такое NitroGen?

Источник: nitrogen.minedojo.org
Ответ: Это фундаментальная ИИ-модель общего назначения для управления игровыми агентами, способная играть в более чем 1000 видеоигр, анализируя только визуальный поток кадров с экрана.

Как модель научилась играть без доступа к программному коду игр?

Источник: NitroGen Research Paper (PDF)
Ответ: Через имитационное обучение на основе 40 000 часов видео геймплея с YouTube и Twitch. Система использовала алгоритмы для распознавания оверлеев геймпадов на стримах, сопоставляя действия игроков с событиями на экране.

Какова точность управления этим ИИ?

Источник: nitrogen.minedojo.org/results
Ответ: Исследования показали высокую точность извлечения действий: коэффициент корреляции ($R^2$) для джойстиков (стиков) составил 0,84, а точность нажатия кнопок во фрейме — 0,96.

Как проект NitroGen связан с робототехникой?

Источник: Jim Fan (NVIDIA AI) Blog/X
Ответ: Архитектура модели напрямую основана на системе GR00T N1.5, созданной NVIDIA для управления гуманоидными роботами. Обучение в видеоиграх рассматривается как этап подготовки универсального «воплощенного ИИ» для реального мира.

Материал по теме:  Умный дом — это не будущее, а настоящее: 5 причин, почему он нужен каждой многоэтажке

Доступна ли модель NitroGen для скачивания?

Источник: Hugging Face: NVIDIA NitroGen
Ответ: Да, NVIDIA опубликовала веса модели, исходный код и инструментарий для работы с данными в открытом доступе на платформах Hugging Face и GitHub.

В каких жанрах игр NitroGen показывает лучшие результаты?

Источник: NitroGen Technical Paper
Ответ: Модель наиболее оптимизирована для игр с поддержкой геймпада: лидерами по объему обучающих данных стали Action-RPG (34,9%), платформеры (18,4%) и экшн-приключения (9,2%).

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Прокрутить наверх