Gemini 3: Google учит ИИ собирать визуальные интерфейсы и действовать как агент

Что нового в Gemini 3

Google представила Gemini 3 — крупное обновление своего мультимодального флагманского ИИ. По словам компании, новая модель лучше рассуждает, расширяет мультимодальные возможности для работы с голосом, текстом и изображениями и может выступать в роли агента для выполнения многошаговых задач.

Генеративные интерфейсы и «vibe-coding»

В отличие от предыдущих версий, которые по умолчанию возвращают обычный текст, если не задать формат вывода, Gemini 3 предлагает так называемые генеративные интерфейсы. Модель сама решает, какой формат вывода лучше соответствует запросу, и формирует визуальные макеты и интерактивные элементы. Например, запрос рекомендаций для поездки может породить внутри приложения интерфейс, похожий на сайт, с модулями, изображениями и уточняющими вопросами вроде 'Сколько дней вы путешествуете?' или 'Какие занятия вас интересуют?', а также с кликабельными вариантами для дальнейших действий.

Если модель посчитает, что объяснение будет понятнее в визуальной форме, она может сама сгенерировать схему или простую анимацию. Как отмечает Джош Вудворд, вице-президент Google Labs, Gemini и AI Studio: 'Visual layout generates an immersive, magazine-style view complete with photos and modules. These elements don’t just look good but invite your input to further tailor the results.'

Gemini Agent: выполнение многошаговых задач

Google также вводит Gemini Agent, экспериментальную функцию, которая управляет многошаговыми задачами прямо в приложении. После предоставления доступа к сервисам вроде Google Calendar, Gmail и Reminders агент сможет выполнять действия по организации почты или управлению расписанием. Он разбивает задачу на шаги, отображает прогресс в реальном времени и приостанавливает выполнение для подтверждения пользователем — это шаг к тому, чтобы стать 'настоящим универсальным агентом'. Функция будет доступна в вебе для подписчиков Google AI Ultra в США с 18 ноября.

Глубже в экосистему Google

Gemini 3 теснее интегрирован с продуктами Google. В Поиске ограниченная группа подписчиков Google AI Pro и Ultra сможет переключаться на Gemini 3 Pro — версию модели с улучшенным модулем рассуждения, чтобы получать более глубокие и развернутые AI-резюме, основанные на выводах модели.

В шопинге Gemini будет использовать Shopping Graph Google, в котором, по словам компании, содержится более 50 миллиардов товарных позиций, чтобы формировать интерактивные рекомендации. Достаточно задать вопрос о покупках или выполнить соответствующий поиск, и модель соберет руководство по товарам в стиле Wirecutter с ценами и характеристиками без перехода на внешние сайты.

Инструменты для разработчиков и перспективы

Google продолжает развивать генерацию софта по одному запросу и представил Google Antigravity — платформу для разработки, где код, инструменты и рабочие процессы можно создавать и управлять ими из единого промпта.