



const fs = require('fs');
const path = require('path');
const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/qwen-image-edit',
prompt: 'Make the bubbles heart-shaped',
image: 'https://ark-doc.tos-ap-southeast-1.bytepluses.com/seededit_i2i.jpeg',
size: 'adaptive',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"prompt": "A jellyfish in the ocean",
"model": "alibaba/qwen-image-edit",
"image": "https://ark-doc.tos-ap-southeast-1.bytepluses.com/seededit_i2i.jpeg",
"size": "adaptive",
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

Подробная информация о товаре
✨ Представляем Qwen-Image Edit от Alibaba Cloud: Инновационная модель искусственного интеллекта, разработанная для точного и адаптивного редактирования изображений. Она мастерски сочетает в себе сложное понимание изображений с контекстно-зависимой обработкой, позволяя пользователям легко изменять визуальные элементы с помощью команд на естественном языке или подсказок.
Этот мощный инструмент превосходно справляется с широким спектром операций редактирования, включая удаление объектов, интеллектуальную замену, перенос стиля, настройку фона и детальную проработку, сохраняя при этом безупречный фотореалистичный результат. Лицензия распространяется по лицензии... Лицензия Apache 2.0 с открытым исходным кодомQwen-Image Edit идеально подходит для масштабируемого внедрения в творческих, коммерческих и исследовательских проектах.
🚀 Технические характеристики
- • Максимальное разрешение изображения: До 2048x2048 пикселей для высококачественного редактирования.
- • Архитектура: Усовершенствованный преобразователь визуального и языкового восприятия с механизмами перекрестного внимания для глубокого понимания.
- • Лицензирование: Полностью открытый исходный код Apache 2.0содействуя широкой доступности.
- • Поддерживаемые языки: Всестороннее понимание английский и китайский команды редактирования с расширенными возможностями многоязычной обработки текста.
📈 Тесты производительности
- • Манипулирование объектами: Обеспечивает превосходную точность при изменении объектов и атрибутов, сохраняя при этом общую реалистичность изображения.
- • Восстановление изображения: Демонстрирует превосходные результаты с минимальным количеством артефактов при выполнении реставрационных работ.
- • Редактирование с учетом контекста текста: Обеспечивает точное соответствие правок текстовым инструкциям при вводе.
- • Эффективность: Оптимизированный конвейер редактирования с низкой задержкой, идеально подходящий для изображений мегапиксельного масштаба.
- • Устойчивость: Обладает высокой устойчивостью в сложных сценах, включающих множество объектов и многослойные визуальные элементы.
💰 Цены на API
0,04725 долл. США / изображение
💡 Ключевые возможности
- • Интеллектуальное редактирование контента: Беспрепятственное добавление, удаление и замена объектов с учетом контекста.
- • Перенос стиля и цвета: Примените новые стили и цвета, сохраняя при этом исходный контекст и настроение изображения.
- • Манипулирование фоном: Изменяйте или полностью заменяйте фон, обеспечивая семантическую согласованность.
- • Детальная проработка: Улучшите мельчайшие детали, включая корректировку текстур и исправление теней.
- • Итеративное редактирование: Поддерживает многоэтапное текстовое взаимодействие для постепенного и точного улучшения.
✅ Оптимальные варианты использования
- • Креативный дизайн: Ускорьте рабочие процессы в сфере рекламы, маркетинга и создания цифрового искусства.
- • Восстановление фотографий: Услуги по улучшению и реставрации старых или поврежденных фотографий.
- • Электронная коммерция: Автоматизированная визуальная персонализация товаров для онлайн-торговли.
- • Модерация контента: Инструменты для автоматической корректировки изображений и обеспечения соответствия стандартам.
- • Интерактивные приложения: Бесшовная интеграция с программным обеспечением и приложениями для творчества, позволяющая редактировать контент в режиме реального времени.
💻 Пример кода
↔️ Сравнение с другими ведущими моделями
Qwen-Image Edit против Adobe Firefly
Qwen-Image Edit выделяется как решение с открытым исходным кодомПредлагая широкие возможности настройки для интеграции в различные рабочие процессы, Adobe Firefly, напротив, ориентирован на коммерческих пользователей, предоставляя удобный набор инструментов, богатый художественными фильтрами и фирменными элементами дизайна.
Qwen-Image Edit против стабильной диффузии
Qwen-Image Edit обеспечивает Более четкие края и меньше артефактов В сценариях удаления объектов, наряду с надежной поддержкой сложного многоэтапного редактирования, Stable Diffusion обеспечивает более высокую скорость генерации, но часто с менее точной обработкой сложных изображений.
Qwen-Image Edit против Midjourney
Qwen-Image Edit поддерживает изображения высокого разрешения и предлагает детальную текстовую обработку. Благодаря превосходной доступности открытого исходного кода, Midjourney — популярный выбор для исследования художественных стилей и быстрого прототипирования, хотя он и предлагает более ограниченные возможности прямого редактирования.
❓ Часто задаваемые вопросы (FAQ)
1. Какая архитектура лежит в основе интеллектуальной обработки изображений в Qwen-Image Edit?
Qwen-Image Edit использует архитектуру условного восстановления и удаления изображений с глубоким семантическим пониманием. Она применяет механизмы кросс-модального внимания для выравнивания текстовых инструкций с визуальными областями, обеспечивая контекстно-зависимое редактирование и структурную целостность во время манипулирования объектами. Расширенные возможности сегментации позволяют точно локализовать цели редактирования для бесшовной интеграции.
2. Каким образом модель сохраняет визуальную согласованность во время точного манипулирования объектами?
Модель использует сложные алгоритмы отслеживания сохранения объектов для поддержания визуальных характеристик, согласованности освещения и пространственных взаимосвязей. Она включает в себя сети геометрических преобразований и алгоритмы распространения текстур, а также модели отбрасывания теней, чтобы обеспечить реалистичное взаимодействие отредактированных элементов в сцене и сохранить общую визуальную целостность.
3. Какие задачи редактирования изображений Qwen-Image Edit решает наиболее эффективно?
Qwen-Image Edit превосходно справляется с удалением и заменой семантических объектов, интеллектуальной модификацией фона, точным редактированием атрибутов (цвет, текстура, стиль), добавлением креативных элементов, восстановлением фотографий и переносом стиля. Особенно эффективен в сценариях, требующих понимания семантики сцены и взаимосвязей объектов для создания естественного эффекта.
4. Как модель обрабатывает сложные многоэтапные инструкции по редактированию?
Система использует последовательную обработку инструкций с механизмами памяти, отслеживающими предыдущие изменения. Она поддерживает условное редактирование, постепенное уточнение посредством итеративных корректировок и расширенный анализ инструкций для разбиения сложных рабочих процессов на логические шаги, обеспечивая согласованные и целостные результаты в ходе множества операций.
Игровая площадка для ИИ



Авторизоваться