qwen-bg
max-ico04
出去
max-ico02
聊天
max-ico03
禁用
Qwen 图片编辑
它支持中英文双语文本编辑,能够进行复杂的场景调整、风格迁移和无缝视觉编辑,同时保持图像一致性。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const fs = require('fs');
const path = require('path');

const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'alibaba/qwen-image-edit',
      prompt: 'Make the bubbles heart-shaped',
      image: 'https://ark-doc.tos-ap-southeast-1.bytepluses.com/seededit_i2i.jpeg',
      size: 'adaptive',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A jellyfish in the ocean",
            "model": "alibaba/qwen-image-edit",
            "image": "https://ark-doc.tos-ap-southeast-1.bytepluses.com/seededit_i2i.jpeg",
            "size": "adaptive",
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
  • ico01-1
    API 操练场(Playground)

    在集成之前,请在沙箱环境中测试所有 API 模型。

    我们提供 300 多种模型供您集成到您的应用程序中。

    复制图片02图片01
qwenmax-bg
图片
Qwen 图片编辑

产品详情

✨ 阿里云推出 Qwen 图片编辑: 这是一款突破性的人工智能模型,专为精准且灵活的图像编辑而设计。它巧妙地将复杂的图像理解能力与上下文感知操作相结合,使用户能够通过自然语言命令或引导提示轻松修改图像。

这款强大的工具在各种编辑操作中表现出色,包括对象移除、智能替换、风格迁移、背景调整和精细细节增强,同时还能保持无可挑剔的逼真效果。根据以下许可协议授权: Apache 2.0 开源许可证Qwen-Image Edit 已做好在创意、商业和研究领域进行可扩展部署的准备。

🚀 技术规格

  • • 最大图像分辨率: 至多 2048x2048像素 用于高保真编辑。
  • • 建筑学: 具有交叉注意力机制的高级视觉语言转换器,用于深度理解。
  • • 许可: 完全开源 Apache 2.0促进广泛普及。
  • • 支持的语言: 全面了解 英文和中文 编辑命令,具备更广泛的多语言文本处理功能。

📈 性能基准测试

  • • 物体操作: 在修改对象和属性时能够实现极高的精度,同时保持整体图像的真实感。
  • • 图像修复: 在修复任务中表现出色,且产生的痕迹极少。
  • • 文本条件编辑: 确保编辑内容与输入的文本指令精确对齐。
  • • 效率: 优化的低延迟编辑流程,非常适合百万像素级图像。
  • • 鲁棒性: 在包含多个物体和多层视觉元素的复杂场景中具有很高的适应性。

💰 API 定价

每张图片 0.04725 美元

💡 主要功能

  • • 智能内容编辑: 具备上下文感知能力,可实现对象的无缝添加、删除和替换。
  • • 款式和颜色转移: 在保留原图背景和氛围的前提下,运用新的风格和色彩。
  • • 背景操控: 修改或完全替换背景,使其在语义上保持一致。
  • • 精细细节处理: 增强细微之处,包括纹理调整和阴影校正。
  • • 迭代编辑: 支持多轮文本交互,以实现渐进式和精细化的改进。

✅ 最佳使用场景

  • • 创意设计: 加快广告、营销和数字艺术创作的工作流程。
  • • 照片修复: 提供老旧或损坏照片的增强和修复服务。
  • • 电子商务: 面向在线零售的自动化产品视觉定制。
  • • 内容审核: 用于自动图像调整和合规性的工具。
  • • 交互式应用程序: 可与创意软件和应用程序无缝集成,实现实时编辑。

💻 代码示例

↔️ 与其他领先型号的比较

Qwen-Image Edit 与 Adob​​e Firefly 的比较

Qwen-Image Edit 的独特之处在于 开源解决方案提供丰富的自定义选项,可集成到各种工作流程中。相比之下,Adobe Firefly 则面向商业用户,提供一套用户友好的工具,其中包含丰富的艺术滤镜和专有品牌素材。

Qwen图像编辑与稳定扩散

Qwen-Image Edit 提供 更清晰的边缘和更少的瑕疵 在物体移除场景中,稳定扩散算法除了支持复杂的多轮编辑外,还能提供更快的生成速度,但在处理复杂图像时,其编辑精度往往较低。

Qwen-Image Edit 与 Midjourney 对比

Qwen-Image Edit 支持 高分辨率图像,并提供详细的文本润色。 Midjourney 拥有卓越的开源易用性,是探索艺术风格和快速原型制作的热门选择,但其直接编辑控制功能较为有限。

❓ 常见问题解答 (FAQ)

1. Qwen-Image Edit 的智能图像处理技术基于怎样的架构?

Qwen-Image Edit 采用条件式图像修复和图像替换架构,并具备深厚的语义理解能力。它运用跨模态注意力机制,将文本指令与视觉区域对齐,确保在对象操作过程中实现上下文感知编辑和结构完整性。先进的分割功能能够精确定位编辑目标,实现无缝集成。

2. 该模型如何在精确操作物体时保持视觉连贯性?

该模型采用了复杂的物体持久性跟踪技术,以保留视觉特征、光照一致性和空间关系。它结合了几何变换网络和纹理传播算法,以及阴影投射模型,确保编辑后的元素在场景中能够真实地交互,从而保持整体视觉连贯性。

3. Qwen-Image Edit 最能有效地处理哪些图像编辑任务?

Qwen-Image Edit 在语义对象移除和替换、智能背景修改、精确属性编辑(颜色、纹理、样式)、创意元素添加、照片修复和风格迁移方面表现出色。尤其在需要理解场景语义和对象关系以实现自然逼真修改的场景中,它的优势更为突出。

4. 该模型如何管理复杂的多步骤编辑指令?

该系统采用顺序指令处理,并配备记忆机制以跟踪先前的修改。它支持条件编辑、通过迭代调整进行渐进式改进,以及高级指令解析,可将复杂的工作流程分解为逻辑步骤,从而确保在多个操作中获得一致且连贯的结果。

了解如何利用 AICC API 实现公司转型

探索如何利用 AICC API 革新您的业务!解锁强大的工具,实现流程自动化、增强决策能力并打造个性化的客户体验。
联系销售
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用