在

出去

聊天

禁用

Qwen 图片编辑

它支持中英文双语文本编辑，能够进行复杂的场景调整、风格迁移和无缝视觉编辑，同时保持图像一致性。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const fs = require('fs');
const path = require('path');

const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'alibaba/qwen-image-edit',
      prompt: 'Make the bubbles heart-shaped',
      image: 'https://ark-doc.tos-ap-southeast-1.bytepluses.com/seededit_i2i.jpeg',
      size: 'adaptive',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A jellyfish in the ocean",
            "model": "alibaba/qwen-image-edit",
            "image": "https://ark-doc.tos-ap-southeast-1.bytepluses.com/seededit_i2i.jpeg",
            "size": "adaptive",
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()

Docs

300 多个适用于 OpenClaw 和 AI 代理的 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

Qwen 图片编辑

产品详情

✨ 阿里云推出 Qwen 图片编辑：这是一款突破性的人工智能模型，专为精准且灵活的图像编辑而设计。它巧妙地将复杂的图像理解能力与上下文感知操作相结合，使用户能够通过自然语言命令或引导提示轻松修改图像。

这款强大的工具在各种编辑操作中表现出色，包括对象移除、智能替换、风格迁移、背景调整和精细细节增强，同时还能保持无可挑剔的逼真效果。根据以下许可协议授权： Apache 2.0 开源许可证Qwen-Image Edit 已做好在创意、商业和研究领域进行可扩展部署的准备。

🚀 技术规格

• 最大图像分辨率：至多 2048x2048像素用于高保真编辑。
• 建筑学：具有交叉注意力机制的高级视觉语言转换器，用于深度理解。
• 许可：完全开源 Apache 2.0促进广泛普及。
• 支持的语言：全面了解英文和中文编辑命令，具备更广泛的多语言文本处理功能。

📈 性能基准测试

• 物体操作：在修改对象和属性时能够实现极高的精度，同时保持整体图像的真实感。
• 图像修复：在修复任务中表现出色，且产生的痕迹极少。
• 文本条件编辑：确保编辑内容与输入的文本指令精确对齐。
• 效率：优化的低延迟编辑流程，非常适合百万像素级图像。
• 鲁棒性：在包含多个物体和多层视觉元素的复杂场景中具有很高的适应性。

💰 API 定价

每张图片 0.04725 美元

💡 主要功能

• 智能内容编辑：具备上下文感知能力，可实现对象的无缝添加、删除和替换。
• 款式和颜色转移：在保留原图背景和氛围的前提下，运用新的风格和色彩。
• 背景操控：修改或完全替换背景，使其在语义上保持一致。
• 精细细节处理：增强细微之处，包括纹理调整和阴影校正。
• 迭代编辑：支持多轮文本交互，以实现渐进式和精细化的改进。

✅ 最佳使用场景

• 创意设计：加快广告、营销和数字艺术创作的工作流程。
• 照片修复：提供老旧或损坏照片的增强和修复服务。
• 电子商务：面向在线零售的自动化产品视觉定制。
• 内容审核：用于自动图像调整和合规性的工具。
• 交互式应用程序：可与创意软件和应用程序无缝集成，实现实时编辑。

💻 代码示例

↔️ 与其他领先型号的比较

Qwen-Image Edit 与 Adobe Firefly 的比较

Qwen-Image Edit 的独特之处在于开源解决方案提供丰富的自定义选项，可集成到各种工作流程中。相比之下，Adobe Firefly 则面向商业用户，提供一套用户友好的工具，其中包含丰富的艺术滤镜和专有品牌素材。

Qwen图像编辑与稳定扩散

Qwen-Image Edit 提供更清晰的边缘和更少的瑕疵在物体移除场景中，稳定扩散算法除了支持复杂的多轮编辑外，还能提供更快的生成速度，但在处理复杂图像时，其编辑精度往往较低。

Qwen-Image Edit 与 Midjourney 对比

Qwen-Image Edit 支持高分辨率图像，并提供详细的文本润色。 Midjourney 拥有卓越的开源易用性，是探索艺术风格和快速原型制作的热门选择，但其直接编辑控制功能较为有限。

❓ 常见问题解答 (FAQ)

1. Qwen-Image Edit 的智能图像处理技术基于怎样的架构？

Qwen-Image Edit 采用条件式图像修复和图像替换架构，并具备深厚的语义理解能力。它运用跨模态注意力机制，将文本指令与视觉区域对齐，确保在对象操作过程中实现上下文感知编辑和结构完整性。先进的分割功能能够精确定位编辑目标，实现无缝集成。

2. 该模型如何在精确操作物体时保持视觉连贯性？

该模型采用了复杂的物体持久性跟踪技术，以保留视觉特征、光照一致性和空间关系。它结合了几何变换网络和纹理传播算法，以及阴影投射模型，确保编辑后的元素在场景中能够真实地交互，从而保持整体视觉连贯性。

3. Qwen-Image Edit 最能有效地处理哪些图像编辑任务？

Qwen-Image Edit 在语义对象移除和替换、智能背景修改、精确属性编辑（颜色、纹理、样式）、创意元素添加、照片修复和风格迁移方面表现出色。尤其在需要理解场景语义和对象关系以实现自然逼真修改的场景中，它的优势更为突出。

4. 该模型如何管理复杂的多步骤编辑指令？

该系统采用顺序指令处理，并配备记忆机制以跟踪先前的修改。它支持条件编辑、通过迭代调整进行渐进式改进，以及高级指令解析，可将复杂的工作流程分解为逻辑步骤，从而确保在多个操作中获得一致且连贯的结果。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

300 多个 AI 模型
OpenClaw 和人工智能代理

节省20%的费用