title: "Обзор FireRed-Image-Edit 1.1: новый лидер в генеративном редактировании изображений"
date: 2026-03-03
categories: [AI, Computer Vision]
tags: [FireRed, Генерация изображений, SOTA, Diffusion Transformer]
Примечание автора: Полный разбор модели для редактирования изображений FireRed Image Edit 1.1 от команды的小红书 (Xiaohongshu), охватывающий 5 ключевых возможностей, результаты бенчмарков, техническую архитектуру и способы подключения через API. Эта открытая SOTA-модель превзошла Qwen от Alibaba.
3 марта 2026 года команда FireRed из的小红书 (Xiaohongshu) представила FireRed-Image-Edit 1.1 — базовую модель для редактирования изображений, построенную на архитектуре Diffusion Transformer. Модель заняла первое место среди открытых решений (SOTA) в трех основных бенчмарках: ImgEdit, GEdit и REDEdit. С комплексным показателем 7,94 балла она обошла Qwen-Image-Edit-2511 (7,88 балла), став на текущий момент мощнейшей открытой моделью для редактирования изображений.
Главное: Прочитав эту статью, вы узнаете о 5 ключевых возможностях FireRed Image Edit 1.1, инновациях в ее архитектуре и о том, как быстро начать работу с ней через API.

Основные моменты FireRed Image Edit 1.1
| Параметр | Описание | Преимущество |
|---|---|---|
| SOTA с открытым кодом | Общая оценка ImgEdit 4.56, GEdit 7.94 | Превосходит Qwen-Image-Edit |
| Согласованность лиц | Механизм дифференцируемых потерь согласованности, высокая точность черт лица | Редактирование портретов без искажений |
| Мультиэлементная интеграция | Поддержка свободного объединения 10+ элементов | Автоматическая обрезка и компоновка через Agent |
| Двуязычность (RU/EN) | Оценка на 1673 двуязычных парах редактирования | Нативная поддержка текстовых инструкций |
| Apache 2.0 | Полностью открытый код, поддержка коммерческого использования | Бесплатно для бизнеса |
Что такое FireRed Image Edit 1.1
FireRed-Image-Edit — это базовая модель для редактирования изображений, разработанная командой FireRed из Xiaohongshu. В отличие от стандартных моделей текст-в-изображение, она специализируется именно на редактировании изображений: выполняет точные изменения на основе естественного языка, сохраняя при этом ключевое содержание оригинала.
Вы можете загрузить до 3 эталонных изображений и описать желаемый результат на естественном языке. Модель интеллектуально интегрирует элементы, стиль и персонажей с эталонных изображений в итоговый результат.
Основные улучшения версии 1.1 по сравнению с 1.0:
- Значительная оптимизация согласованности лиц: более точное сохранение черт лица при смене фона или переносе стиля.
- Улучшенная интеграция элементов: качественная обработка сложных сценариев с комбинированием нескольких изображений.
- Стилизация текста: поддержка более широкого спектра шрифтов и стилей верстки.
- Макияж на портретах: добавлена функция детального редактирования макияжа.
5 ключевых возможностей FireRed Image Edit 1.1
Возможность 1: Сохранение согласованности лиц (Identity Consistency)
Это главное обновление версии 1.1. Благодаря инновационному механизму дифференцируемых потерь согласованности (Differentiable Consistency Loss), модель точно сохраняет черты лица, мимику и индивидуальные особенности при редактировании портретов.
Сценарии применения:
- Замена фона на фото при сохранении неизменного лица.
- Применение художественных стилей с сохранением личности.
- Композиция персонажа в разных сценах с сохранением внешности.
Традиционные модели часто сталкиваются с проблемой "искажения лиц" при переносе стиля, из-за чего человек становится похож на другого. FireRed 1.1 решает эту проблему за счет минимизации различий в идентификации на протяжении всего процесса генерации.
Возможность 2: Мультиэлементная интеграция (Multi-Element Fusion)
FireRed 1.1 поддерживает свободное комбинирование более 10 визуальных элементов, дополненное функциями автоматической обрезки и компоновки под управлением Agent:
| Тип интеграции | Описание | Типичный сценарий |
|---|---|---|
| Персонаж + фон | Помещение персонажа в новую сцену | Смена фона у фотомодели |
| Персонаж + одежда | Эффект виртуальной примерки | Демонстрация одежды в e-commerce |
| Группа людей | Объединение персонажей с разных фото | Креативный коллаж для постера |
| Стиль + контент | Перенос стиля с эталона на контент | Перенос художественного стиля |
| Текст + изображение | Естественная интеграция текста | Обложки для соцсетей |
Возможность 3: Точное следование инструкциям (Instruction Following)
Модель использует технологию стохастического выравнивания инструкций (Stochastic Instruction Alignment) в сочетании с динамической переиндексацией промптов, что гарантирует высокое соответствие результата запросу пользователя.
Тесты показывают, что по метрике следования инструкциям в бенчмарке REDEdit-Bench модель FireRed 1.1 показывает:
- Оценка для инструкций на китайском: 4.33
- Оценка для инструкций на английском: 4.26
Это означает, что модель понимает не только простые запросы вроде "замени фон на пляж", но и справляется со сложными описаниями: "сохрани персонажа, замени фон на тропический пляж на закате, добавь мягкое теплое освещение".

能力四: 高保真文字编辑(Text Editing)
Благодаря технологии DiffusionNFT и механизму вознаграждения OCR с учетом разметки (layout-aware), FireRed 1.1 может точно сохранять и редактировать текстовый контент на изображениях. Это критически важно в практическом применении — многие модели редактирования размывают или искажают текст при обработке.
能力五: 旧照修复与风格迁移
FireRed 1.1 отлично справляется с восстановлением старых фотографий и переносом стилей:
- Восстановление старых фото: автоматическое удаление царапин, коррекция выцветших цветов и устранение размытости.
- Перенос стиля: конвертация фотографий в масляную живопись, акварель, аниме и другие стили.
- Редактирование макияжа: новая функция детальной коррекции макияжа, добавленная в 1.1.
Результаты бенчмарка FireRed Image Edit 1.1
Лидерство по всем ключевым показателям
| Бенчмарк | FireRed 1.1 | Qwen-Image-Edit | Результат |
|---|---|---|---|
| ImgEdit (общий) | 4.56 | 4.51 | ✅ Победа FireRed |
| GEdit (общий G_O) | 7.94 (EN) / 7.89 (CN) | 7.88 | ✅ Победа FireRed |
| REDEdit (китайский) | 4.33 | — | SOTA среди Open Source |
| REDEdit (английский) | 4.26 | — | SOTA среди Open Source |
Детализация показателей GEdit
| Метрика | Оценка (EN) | Оценка (CN) | Описание |
|---|---|---|---|
| G_SC (семантическая согласованность) | 8.363 | 8.287 | Соответствие результата промпту |
| G_PQ (качество восприятия) | 8.245 | 8.227 | Визуальное качество изображения |
| G_O (общий балл) | 7.943 | 7.887 | Взвешенная итоговая оценка |
REDEdit-Bench — это собственный бенчмарк команды FireRed, включающий 15 категорий и 1 673 двуязычных (китайско-английских) пары для редактирования, что гораздо лучше отражает реальные потребности пользователей.
🎯 Производительность: Модель FireRed 1.1 показывает лучшие результаты в задачах на согласованность лиц и следование инструкциям, что делает её идеальным выбором для редактирования портретов. Сервис-прокси API APIYI (apiyi.com) планирует интеграцию этой модели. Если вам это интересно, свяжитесь с нами для получения подробностей.

Техническая архитектура FireRed Image Edit 1.1
Основная архитектура: Двухпотоковый мультимодальный диффузионный Transformer (MM-DiT)
Движком генерации в FireRed 1.1 является двухпотоковый мультимодальный диффузионный Transformer (MM-DiT):
- Текстовые эмбеддинги: промпты пользователя преобразуются в семантические векторы с помощью текстового энкодера.
- Latent-токены изображения: исходное изображение кодируется через VAE в латентное представление.
- Признаки эталонного изображения: извлекаются визуальные признаки эталонных изображений (до 3 штук).
- Единый поток ввода: три потока данных объединяются и подаются в MM-DiT для интенсивного двунаправленного взаимодействия.
- Вывод: модель генерирует латентное представление отредактированного изображения, которое затем декодируется VAE в финальный результат.
Процесс обучения: Pretrain → SFT → RL
FireRed 1.1 прошел полный цикл трехэтапного обучения:
- Предварительное обучение (Pretrain): на огромном корпусе данных объемом 1,6 млрд примеров, из которых более 100 млн — высококачественные данные.
- Контролируемая донастройка (SFT): тонкая настройка специально для задач редактирования.
- Обучение с подкреплением (RL): использование алгоритма DPO с асимметричной градиентной оптимизацией для улучшения результатов редактирования.
Ключевые технические инновации
| Технология | Назначение | Эффект |
|---|---|---|
| Дифференцируемая функция потерь согласованности | Удержание идентичности | Лица при редактировании не искажаются |
| Случайное выравнивание инструкций | Понимание промптов | Точное выполнение сложных описаний |
| Многоусловная бакетная выборка | Эффективность обучения | Поддержка обработки батчей с разным разрешением |
| DiffusionNFT | Редактирование текста | Четкий текст на изображениях без размытия |
| Асимметричный градиентный DPO | Оптимизация качества | Согласование с предпочтениями пользователей |
💡 Взгляд разработчика: Возможности редактирования FireRed 1.1 можно перенести на любую базовую модель текст-в-изображение. Это значит, что перед нами не просто модель для правки картинок, а полноценный переиспользуемый фреймворк для задач редактирования.
Руководство по интеграции API FireRed Image Edit 1.1
Доступные платформы API
API для FireRed Image Edit 1.1 уже доступно на нескольких сторонних платформах:
| Платформа | Примерная стоимость | Особенности |
|---|---|---|
| Replicate | ~$0.036 за запрос | Оплата за вызов, простота использования |
| fal.ai | По факту использования | Serverless-развертывание, быстрый отклик |
| WaveSpeedAI | По факту использования | Фокус на ускорении моделей обработки изображений |
| HuggingFace Spaces | Бесплатный доступ | Онлайн-демо, без написания кода |
Требования для локального развертывания
Если вам нужно развернуть FireRed 1.1 локально:
- Видеопамять: 30 ГБ VRAM (рекомендуются A100 или H100)
- Скорость инференса: прибл. 4.5 сек./изображение
- Лицензия: Apache 2.0, разрешено коммерческое использование
- Источник модели: HuggingFace
FireRedTeam/FireRed-Image-Edit-1.1
Интеграция через APIYI
На данный момент FireRed Image Edit 1.1 еще не доступна на платформе APIYI, однако модель уже проходит техническую оценку и подготовку к интеграции.
🔔 Анонс: APIYI (apiyi.com) оценивает возможность добавления модели FireRed Image Edit 1.1. Если вам нужен API для редактирования изображений, свяжитесь с командой APIYI, чтобы узнать о прогрессе и записаться на тестирование. После запуска на платформе вы сможете вызывать модель через единый интерфейс без необходимости самостоятельного развертывания.
Варианты использования FireRed Image Edit 1.1
Электронная коммерция и создание контента
- Редактирование карточек товаров: замена фона, настройка освещения, добавление сцены
- Виртуальная примерка: создание эффекта примерки одежды, снижение расходов на фотосессии
- Обложки для соцсетей: быстрая генерация обложек в едином стиле
- Реставрация фото: восстановление старых снимков, повышение качества изображений
Дизайн и креатив
- Стилизация: преобразование фотографий в различные художественные стили
- Креативный синтез: комбинирование нескольких элементов для создания рекламных постеров
- Брендинг: пакетная обработка изображений для поддержания единого визуального стиля бренда
Сравнение с другими моделями генерации изображений
| Модель | Позиционирование | Основное преимущество | Сценарии использования |
|---|---|---|---|
| FireRed Image Edit 1.1 | Редактирование | Согласованность лиц, следование инструкциям | Точное редактирование существующих фото |
| Gemini Imagen 4 | Текст-в-изображение | Высокое качество генерации | Создание новых изображений с нуля |
| DALL-E 3 | Текст-в-изображение | Рендеринг текста | Креативная генерация |
| Stable Diffusion 3 | Текст-в-изображение + ред. | Открытая экосистема | Гибкая настройка |
Ключевое отличие FireRed 1.1 заключается в том, что: она не создает новые изображения с нуля, а выполняет точное редактирование уже существующих. Это делает модель идеальной для e-commerce и креативных индустрий, где требуется вторичная обработка реальных материалов.
🚀 Совет по выбору: Если вам нужно «точное редактирование на основе готового изображения» (замена фона, стиля, добавление элементов), FireRed — лучший выбор среди open-source решений. Если же требуется генерация «текст-в-изображение», используйте модели вроде Gemini Imagen или DALL-E через платформу APIYI (apiyi.com) для максимально гибкой настройки под ваши задачи.
Часто задаваемые вопросы
Q1: Можно ли использовать FireRed Image Edit 1.1 в коммерческих целях бесплатно?
Да. FireRed Image Edit 1.1 распространяется по лицензии Apache 2.0, которая разрешает свободное использование, модификацию и распространение, включая коммерческие проекты. Вы можете скачать веса модели с HuggingFace для локального развертывания или использовать сторонние платформы с оплатой по факту использования.
Q2: В чем разница между FireRed 1.1 и 1.0 и какую версию лучше выбрать?
Рекомендуем сразу использовать версию 1.1. По сравнению с 1.0 в версии 1.1 основной упор был сделан на улучшение согласованности лиц, смешение нескольких элементов, стилизацию текста и наложение макияжа. Это полноценное обновление по всем фронтам без потери качества. Общая оценка 1.1 в GEdit достигла 7.94, тогда как у 1.0 этот показатель был ниже.
Q3: Какое оборудование нужно для локального развертывания?
Для работы FireRed 1.1 требуется минимум 30 ГБ видеопамяти; рекомендуется использовать графические процессоры NVIDIA A100 (40/80 ГБ) или H100. Если у вас нет доступа к мощным GPU, лучше использовать модель через API — например, на Replicate один вызов стоит около $0,036. В дальнейшем вызов также будет доступен через APIYI apiyi.com.
Q4: Когда APIYI добавит поддержку FireRed Image Edit?
FireRed Image Edit 1.1 сейчас находится на этапе технической оценки на платформе APIYI. Если у вас есть конкретные потребности в API для редактирования изображений, свяжитесь с командой APIYI apiyi.com — ваш запрос поможет нам ускорить процесс оценки и интеграции.
Итоги
Основные моменты FireRed Image Edit 1.1:
- SOTA с открытым кодом: Общая оценка GEdit — 7.94, ImgEdit — 4.56, что значительно превосходит показатели Qwen-Image-Edit-2511.
- Лидерство в согласованности лиц: Механизм дифференцируемых потерь гарантирует, что редактирование портретов не приведет к «подмене лица».
- Нативная поддержка китайского языка: Модель разработана командой Xiaohongshu и отлично справляется с промптами как на китайском, так и на английском языках.
- Полностью открытый код для коммерческого использования: Лицензия Apache 2.0, доступна для загрузки прямо с HuggingFace.
- Эффективный инференс: Для развертывания достаточно 30 ГБ видеопамяти, скорость генерации — 4,5 секунды на изображение.
Для разработчиков и компаний, которым требуются точные инструменты редактирования изображений, FireRed 1.1 — лучший выбор среди решений с открытым кодом на текущий момент.
APIYI apiyi.com активно оценивает возможность интеграции FireRed Image Edit 1.1. Если вам это интересно, свяжитесь с нами заранее. Платформа уже поддерживает унифицированный вызов моделей Gemini, Claude, GPT и других; добавление моделей для редактирования изображений еще больше расширит наши возможности в работе с мультимодальными API.
📚 Справочные материалы
-
Репозиторий FireRed-Image-Edit на GitHub: официальный исходный код и документация.
- Ссылка:
github.com/FireRedTeam/FireRed-Image-Edit - Примечание: содержит полный исходный код, ссылки на скачивание весов модели и примеры использования.
- Ссылка:
-
FireRed-Image-Edit 1.1 на HuggingFace: скачивание весов модели.
- Ссылка:
huggingface.co/FireRedTeam/FireRed-Image-Edit-1.1 - Примечание: можно напрямую скачать веса модели для локального развертывания.
- Ссылка:
-
Технический отчет FireRed-Image-Edit 1.0: научная статья.
- Ссылка:
arxiv.org/abs/2602.13344 - Примечание: подробное описание архитектурного дизайна и методов обучения.
- Ссылка:
-
Бенчмарк REDEdit-Bench: методология тестирования.
- Ссылка:
github.com/FireRedTeam/FireRed-Image-Edit - Примечание: стандарт оценки, включающий 15 категорий и 1673 двуязычные пары для редактирования.
- Ссылка:
Автор: Техническая команда APIYI
Обмен опытом: делитесь своими наработками в области редактирования изображений с помощью ИИ в комментариях. Больше информации о моделях ИИ доступно в центре документации APIYI по адресу docs.apiyi.com