qwen-bg
max-ico04
出去
max-ico02
聊天
max-ico03
禁用
Wan 2.5 预览
它灵活的尺寸支持和高质量的输出使其成为创意应用程序、营销工具、内容管理系统和设计软件的理想选择。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'alibaba/wan2.5-t2i-preview',
      prompt: 'A jellyfish in the ocean',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "alibaba/wan2.5-t2i-preview",
            "prompt": "A jellyfish in the ocean",
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
qwenmax-bg
图片
Wan 2.5 预览

产品详情

Wan 2.5 预览 这款产品代表了文本转图像生成技术的尖端水平,是在广受好评的 Wan 系列基础上打造而成。此次迭代引入了多项重大改进,主要体现在取消了之前对图像边长的限制,使用户能够在限定的像素区域内灵活选择像素尺寸。它巧妙地融合了先进的 AI 架构和精细的像素级控制,能够根据简单的文本提示生成丰富多样、细节丰富且高度逼真的图像。

🔧 技术规格

  • 型号: 文本到图像生成模型
  • 建筑学: 先进的基于扩散的生成网络
  • 输入: 自然语言文本提示
  • 输出: 可变分辨率图像,任意尺寸在支持的像素范围内
  • 训练数据: 包含艺术作品、照片和数字插图等多种模态的多元化数据集
  • 支持的语言: 主要 英语可通过分词适应其他语言

📈 性能基准测试

  • FID 分数(Fréchet 起始距离): 13.5 在标准图像生成基准测试中,显示出较高的真实感和质量。
  • 推理速度: 平均世代时间 4秒 在现代GPU上,每张512x512图像的处理速度。
  • 内存使用情况: 针对以下平台进行了优化: 12GB及以上 GPU显存配置。
  • 分辨率支持: 成功生成图像,最高可达 4K及以上分辨率 质量不下降。
  • 多样性: 针对同一提示生成各种独特的图像,支持创意探索。

💲 API 定价

仅有的 每张图片 0.0315 美元

🔑 主要功能

  • 高质量细节: 生产 清晰而精细的图像特征 涵盖各种风格和主题。
  • 灵活的风格适应性: 能够根据提示语境生成艺术性、写实性或风格化的图像。
  • 快速推理: 高效的模型设计能够 更快的图像生成 与之前的版本相比。
  • 可扩展分辨率: 适用于小型数字缩略图,最大尺寸为 大型印刷品和演示文稿

🚀 应用案例

  • 数字艺术创作: 非常适合需要定制任何尺寸和风格的艺术作品的艺术家。
  • 市场营销与广告: 快速制作符合宣传活动需求的高质量视觉素材。
  • 内容生成: 用独特的图片提升博客、社交媒体和网站的吸引力。
  • 原型制作与设计: 在早期开发阶段生成概念图和产品视觉图。
  • 教育材料: 为教学资源创作引人入胜的插图或信息图。
  • 娱乐与媒体: 可用于故事板绘制、角色概念设计以及视觉特效素材制作。

💻 代码示例

🔄 与其他型号的比较

与稳定扩散相比: Wan 2.5 针对以下方面进行了优化 高分辨率图像和快速推理 并且在大尺寸下质量始终如一,而稳定扩散在放大时有时会出现质量下降。

vs DALL·E 3: Wan 2.5 预览版提供 灵活的尺寸控制 使用户能够自由调整输出尺寸,这对于专业的设计和印刷应用来说尤其有利。

对阵 Midjourney: Wan 2.5 Preview 在尺寸自定义方面更加灵活,支持快速生成风格化和照片级写实输出,吸引了有此需求的用户。 尺寸灵活,细节不减

对比图像: Wan 2.5 Preview 通过允许超越 Imagen 可自由选择图像尺寸 在像素面积限制内,为各种使用场景和可直接打印的结果提供了更大的适应性。

💭 常见问题解答 (FAQ)

什么是 Wan 2.5 预览版?

Wan 2.5 Preview 是 Wan 系列文本转图像模型的最新版本,该系列模型以其能够根据文本提示生成高保真图像而闻名。其主要创新之处在于取消了之前对图像边长的限制,从而在定义的像素区域内提供了灵活且不受限制的像素尺寸选择。

Wan 2.5 Preview 与其他主流型号相比如何?

Wan 2.5 Preview 的突出之处在于其针对高分辨率图像的优化、快速推理以及在大尺寸下始终如一的质量,解决了 Stable Diffusion 在缩放时有时会出现的质量下降问题。与 DALL·E 3、Midjourney 和 Imagen 相比,Wan 2.5 提供更灵活的尺寸控制,使其在专业设计、印刷应用和多样化的输出定制方面极具优势,且不会牺牲细节。

Wan 2.5 Preview 的主要使用场景是什么?

它非常适合各种应用,包括数字艺术创作、营销和广告视觉效果、博客和社交媒体的一般内容生成、原型制作和设计、教育材料以及娱乐和媒体制作,如故事板和视觉特效。

Wan 2.5 Preview 的 API 定价是多少?

Wan 2.5 Preview 的 API 定价为每生成一张图像 0.0315 美元,价格非常实惠。

Wan 2.5 Preview 的关键性能指标是什么?

它拥有13.5的FID评分(高质量),平均推理速度为每张512x512图像4秒,针对12GB以上的GPU显存进行了内存优化,并支持高达4K及以上的分辨率而不会降低图像质量。此外,它还能针对同一提示生成多种不同的图像。

API 操练场(Playground)

集成前,请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。
免费试用
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用