Gemini 3: Google учит ИИ собирать визуальные интерфейсы и действовать как агент
'Gemini 3 научился собирать визуальные, интерактивные ответы и получил экспериментальный Gemini Agent для выполнения многошаговых задач внутри сервисов Google.'
Что нового в Gemini 3
Google представила Gemini 3 — крупное обновление своего мультимодального флагманского ИИ. По словам компании, новая модель лучше рассуждает, расширяет мультимодальные возможности для работы с голосом, текстом и изображениями и может выступать в роли агента для выполнения многошаговых задач.
Генеративные интерфейсы и «vibe-coding»
В отличие от предыдущих версий, которые по умолчанию возвращают обычный текст, если не задать формат вывода, Gemini 3 предлагает так называемые генеративные интерфейсы. Модель сама решает, какой формат вывода лучше соответствует запросу, и формирует визуальные макеты и интерактивные элементы. Например, запрос рекомендаций для поездки может породить внутри приложения интерфейс, похожий на сайт, с модулями, изображениями и уточняющими вопросами вроде 'Сколько дней вы путешествуете?' или 'Какие занятия вас интересуют?', а также с кликабельными вариантами для дальнейших действий.
Если модель посчитает, что объяснение будет понятнее в визуальной форме, она может сама сгенерировать схему или простую анимацию. Как отмечает Джош Вудворд, вице-президент Google Labs, Gemini и AI Studio: 'Visual layout generates an immersive, magazine-style view complete with photos and modules. These elements don’t just look good but invite your input to further tailor the results.'
Gemini Agent: выполнение многошаговых задач
Google также вводит Gemini Agent, экспериментальную функцию, которая управляет многошаговыми задачами прямо в приложении. После предоставления доступа к сервисам вроде Google Calendar, Gmail и Reminders агент сможет выполнять действия по организации почты или управлению расписанием. Он разбивает задачу на шаги, отображает прогресс в реальном времени и приостанавливает выполнение для подтверждения пользователем — это шаг к тому, чтобы стать 'настоящим универсальным агентом'. Функция будет доступна в вебе для подписчиков Google AI Ultra в США с 18 ноября.
Глубже в экосистему Google
Gemini 3 теснее интегрирован с продуктами Google. В Поиске ограниченная группа подписчиков Google AI Pro и Ultra сможет переключаться на Gemini 3 Pro — версию модели с улучшенным модулем рассуждения, чтобы получать более глубокие и развернутые AI-резюме, основанные на выводах модели.
В шопинге Gemini будет использовать Shopping Graph Google, в котором, по словам компании, содержится более 50 миллиардов товарных позиций, чтобы формировать интерактивные рекомендации. Достаточно задать вопрос о покупках или выполнить соответствующий поиск, и модель соберет руководство по товарам в стиле Wirecutter с ценами и характеристиками без перехода на внешние сайты.
Инструменты для разработчиков и перспективы
Google продолжает развивать генерацию софта по одному запросу и представил Google Antigravity — платформу для разработки, где код, инструменты и рабочие процессы можно создавать и управлять ими из единого промпта.
Представители отрасли отмечают практические улучшения. Дерек Ни, CEO Flowith, агентного AI-приложения, сообщил MIT Technology Review, что Gemini 3 Pro устраняет ряд недостатков прежних моделей: лучше понимает визуал, генерирует код качественнее и эффективнее справляется с длинными задачами. 'Given its speed and cost advantages, we’re integrating the new model into our product,' — добавил он, отмечая необходимость более глубокого тестирования, чтобы оценить полный потенциал модели.
Switch Language
Read this article in English