ИИ Genie 3 превращает текстовый запрос в виртуальный мир, который вы можете исследовать
Каждый раз, когда вам кажется, что искусственный интеллект уже не способен удивить своими возможностями, он всё равно делает что-то поразительное

ИИ Genie 3 превращает текстовый запрос в виртуальный мир, который вы можете исследовать/Фото: Google
Компания Google DeepMind представила искусственный интеллект Genie 3, свою самую передовую на сегодняшний день модель для симуляции миров. Система способна генерировать интерактивные, динамичные среды в режиме реального времени с помощью текстовых подсказок.
Детали
Пользователи могут исследовать эти сгенерированные миры с разрешением 720p и частотой 24 кадра в секунду, с сохранением стабильности на протяжении нескольких минут. Просто взгляните на это видео от Google, чтобы увидеть, насколько впечатляюще работает технология. Чтобы сгенерировать похожие миры, людям потребовались бы десятки часов.
Этот релиз основан на многолетних исследованиях DeepMind, где агенты искусственного интеллекта обучались в смоделированных средах для игр, робототехники и обучения. Genie 3 представляет собой значительный шаг по сравнению с предыдущими версиями, Genie 1 и Genie 2, благодаря поддержке навигации в реальном времени и повышенному реализму.
Модели генерации виртуальных миров являются важным шагом к общему искусственному интеллекту. Они позволяют агентам ощущать разнообразные, открытые среды, где те могут узнавать, как развивается мир и как их действия влияют на него.
Genie 3 обеспечивает интерактивность в реальном времени, что является существенным отличием от предыдущих моделей ИИ, которые ограничивались видео или генерацией отдельных кадров. Модель способна имитировать физические явления, такие как вода, освещение и другие природные взаимодействия. Она также может отображать богатые экосистемы, анимировать персонажей и генерировать как реальные, так и вымышленные локации.
Помимо движения и навигации, пользователи могут вводить команды для изменения мира, меняя погоду, добавляя объекты или новых персонажей. Это позволяет имитировать широкий спектр контрфактических сценариев и расширять способы, которыми агенты обучаются непредвиденным изменениям.
При этом Genie 3 всё ещё имеет ряд ограничений: она не может с высокой точностью воспроизводить реальные географические места, текст в сгенерированном мире может быть читаем только в случае, если он точно передан в запросе, ошибки могут быстро накапливаться, а диапазон прямых действий, которые может выполнять агент, всё ещё остаётся узким.
Читайте также: новое исследование учёных демонстрирует, что искусственный интеллект понимает человеческие эмоции лучше, чем сами люди. Типичные модели генеративных ИИ набрали значительно больше баллов в тестах на эмоциональный интеллект.
Не пропустите интересное!
Подписывайтесь на наши каналы и читайте новости в удобном формате!