Google представила «мировую модель» для обучения роботов в виртуальных средах 🤖🏭
Компания Google представила новый шаг к созданию универсального искусственного интеллекта (AGI) с моделью, которая позволяет системам ИИ взаимодействовать с реалистичной симуляцией окружающего мира. Новая «мировая модель» Genie 3 может использоваться для обучения роботов и автономных транспортных средств в виртуальных средах, таких как склады, сообщили в Google.
Подразделение Google DeepMind отмечает, что мировые модели являются ключевым этапом на пути к AGI — гипотетическому уровню ИИ, который способен выполнять большинство задач наравне с человеком, а не только отдельные функции, например, играть в шахматы или переводить тексты. Такие модели также важны для развития автономных агентов — систем, выполняющих задачи самостоятельно.
«Мы ожидаем, что эта технология сыграет ключевую роль на пути к AGI, где автономные агенты будут играть всё большую роль в мире», — заявили в DeepMind.
Google уточнила, что Genie 3 пока не готова к публичному запуску и не назвала точной даты релиза, подчеркнув наличие ряда ограничений модели.
Мировая модель Genie 3 также может использоваться людьми для виртуальных тренировок или исследований, воспроизводя, например, катание на лыжах или прогулку по горному озеру. Моделирование создаётся по текстовым инструкциям, а сценарии легко изменять, добавляя, например, стадо оленей на лыжную трассу.
На презентации для журналистов компания продемонстрировала виртуальные сценарии катания на лыжах и работы на складе. По качеству они сопоставимы с видеомоделью Veo 3 от Google, но длительность симуляций составляет минуты, а не 8 секунд, как у Veo 3.
Эксперты отмечают, что мировые модели помогают развивать роботов и автономные транспортные средства. Например, симуляция склада с реалистичной физикой и присутствием людей позволяет роботу учиться и достигать целей в реальном мире.
Google также создала виртуального агента Sima, который выполняет задачи в игровых средах, но, как и Genie 3, пока недоступен публике.
Профессор Субраманиан Рамамурти из Эдинбургского университета подчеркнул важность мировых моделей для развития гибких роботов: «Чтобы принимать правильные решения, роботы должны прогнозировать последствия действий и выбирать наилучшие».
Эндрю Рогоцкий из Института человеко-центричного ИИ при Университете Суррея отметил, что такие модели полезны и для больших языковых моделей, лежащих в основе чатботов вроде ChatGPT. «Если дать ИИ возможность виртуально взаимодействовать с миром, он сможет исследовать и развивать свои способности», — сказал он.
Google подчеркивает, что мировые модели добавляют важное измерение к обучению ИИ, делая системы более мощными и интеллектуальными.