<НА ГЛАВНУЮ

Nano Banana Pro: Gemini 3 Pro Image для точного текста и студийного качества визуалов

'Nano Banana Pro на базе Gemini 3 Pro обеспечивает точный рендеринг текста, многоязычную локализацию и студийные инструменты для профессионального создания изображений с апскейлингом до 4k.'

Обзор

Nano Banana Pro, также называемая Gemini 3 Pro Image, это новая модель генерации и редактирования изображений от Google DeepMind, основанная на Gemini 3 Pro. Модель ориентирована не только на создание стильных изображений, но и на соблюдение структуры, реальных знаний и компоновки текста, что делает её подходящей для информационно насыщенных визуалов и производственных задач.

Эволюция от Nano Banana

Исходная Nano Banana базировалась на Gemini 2.5 Flash Image и ориентировалась на быстрые, повседневные правки, такие как восстановление фото и генерация стилизованных фигурок по простому запросу. Nano Banana Pro сохраняет такой рабочий поток, но использует более мощное рассуждение и знания Gemini 3 Pro для более сложных задач.

Рассуждение и привязка к поиску

Ключевая идея Nano Banana Pro — генерация, руководимая рассуждением. Модель способна принимать текст, структурированный контент и ссылки, планировать изображение как объяснение этого контента и создавать визуалы, отражающие исходные данные, а не только декоративное оформление. Также модель может подключаться к Google Search и использовать индекс как источник актуальных знаний.

Работа с текстом и многоязычные макеты

Одной из давних проблем генераторов изображений было корректное отображение текста в изображениях. Nano Banana Pro решает эту задачу и позиционируется как лучшая модель в семействе Gemini для рендеринга читаемого текста — от коротких слоганов до полных абзацев. Многоязычные возможности Gemini 3 Pro позволяют отображать и переводить текст на разных языках, сохраняя дизайн и компоновку, например переводя надписи на упаковке без искажения композиции.

Студийное управление, консистентность и апскейлинг

Nano Banana Pro предоставляет элементы управления, ориентированные на дизайн и производственные сценарии, а не на единичные художественные запросы. Модель принимает до 14 входных изображений и может сохранять сходство для до 5 человек в одном рабочем процессе, что полезно для объединения референсов, трансформации эскизов в продуктовые кадры и поддержания одного кастинга в нескольких сценах.

Доступны регулировки угла камеры и типа кадра, глубины резкости и фокусировки на конкретных объектах. Управление цветом и освещением позволяет, например, менять день на ночь, заменять объемное освещение на боке или применять яркий светотеневой эффект, не теряя идентичности субъекта. Поддерживается явный апскейлинг с качественными результатами на 1k, 2k и 4k, а также прогрессивный зум с сохранением детализации и композиции. Соотношение сторон программируется для конверсии между 1:1, 4:3, 16:9 и киноформатами при фиксированном положении главного объекта.

Развертывание, проверяемость и сценарии использования

Google разворачивает Nano Banana Pro в приложениях и сервисах, включая Gemini app, AI Mode в Search, NotebookLM, Google Ads, Workspace, Gemini API, Google AI Studio, Vertex AI, Antigravity и Flow. Все результаты помечаются водяными знаками SynthID и видимыми варьируемыми водяными знаками в зависимости от уровня доступа.

Модель предназначена для задач, таких как преобразование прототипов, таблиц данных и рукописных заметок в точные диаграммы и инфографику, локализация и перевод текста на упаковке и постерах с сохранением макета, а также для производственного создания изображений для разработчиков и предприятий.

Ключевые моменты

  • Nano Banana Pro это Gemini 3 Pro Image, обновлённая модель для генерации и редактирования изображений с упором на качество и управление.
  • Модель сочетает рассуждение Gemini 3 Pro и привязку к Google Search, чтобы превращать фактический контент и документы в визуалы, насыщенные информацией.
  • Обеспечивается надёжный рендеринг текста и многоязычная поддержка при сохранении дизайна.
  • Студийные инструменты позволяют работать с несколькими изображениями, поддерживать консистентность людей, контролировать камеру, свет, соотношение сторон и выполнять апскейлинг до 1k, 2k и 4k.
  • Результаты распространяются по платформам Google и снабжаются маркерами происхождения.
🇬🇧

Switch Language

Read this article in English

Switch to English