SIMA 2 на базе Gemini учится внутри Goat Simulator 3 и других миров
'DeepMind представил SIMA 2, агент на базе Gemini, который учится играть в различные игры включая Goat Simulator 3 и улучшает свои навыки через подсказки и повторные попытки.'
Найдено записей: 14
'DeepMind представил SIMA 2, агент на базе Gemini, который учится играть в различные игры включая Goat Simulator 3 и улучшает свои навыки через подсказки и повторные попытки.'
Gemini Robotics 1.5 отделяет высокоуровневое рассуждение от низкоуровневого контроля, вводит Motion Transfer для переиспользования навыков между разными роботами и усиливает меры безопасности
'Подборка из 12 важных блогов и сайтов по робототехнике и ИИ для следящих за исследованиями, внедрениями и отраслевыми тенденциями в 2025 году.'
'MIT доказали, что on-policy обучение с подкреплением сохраняет ранее приобретённые способности лучше, чем супервизированное дообучение, за счёт минимизации прямого KL-расхождения между базовой и адаптированной моделью.'
'NVIDIA представила Jetson Thor — модуль и набор для разработчиков, которые привносят серверный уровень мультимодального вывода и генеративного рассуждения в роботов. Платформа сочетает мощный GPU, богатые интерфейсы и специализированный софт для реальных сценариев.'
Система ThinkAct от NVIDIA сочетает визуально-языковое рассуждение с усиленным латентным планированием, значительно улучшая управление роботами в сложных задачах.
NVIDIA выпустила GraspGen — инновационную диффузионную систему, значительно улучшающую 6-DOF захваты роботов с помощью масштабного синтетического обучения и новых методов тренировки, показывая высокую эффективность в симуляции и на реальных роботах.
RoboBrain 2.0 от BAAI объединяет зрение и язык для развития воплощённого ИИ в робототехнике, предлагая масштабируемые модели и продвинутые возможности рассуждения.
Hugging Face представила SmolVLA — эффективную и доступную модель визуально-языкового управления, обеспечивающую управление роботами в реальном времени на недорогом оборудовании с открытыми ресурсами.
Артем Соколов, основатель Humanoid, рассказывает о создании универсальных гуманоидных роботов для улучшения рабочих процессов, этическом ИИ и стратегии коммерциализации инновационной робототехники.
Meta AI представила Multi-SpatialMLLM — новую модель, улучшающую многофреймовое пространственное понимание в мультимодальных больших языковых моделях на основе обширного датасета MultiSPA.
Модели с визуально-языковым пониманием и цепочечным рассуждением позволяют ИИ интерпретировать изображения с понятными объяснениями, трансформируя такие сферы, как медицина, автономные автомобили и образование.
NVIDIA Cosmos использует физически обоснованные симуляции для создания синтетических данных, ускоряя обучение физических ИИ-систем, таких как роботы и автономные автомобили.
Gemini Robotics объединяет передовые ИИ-рассуждения и физическое взаимодействие, позволяя роботам выполнять сложные задачи с точностью и гибкостью.