在

出去

聊天

禁用

Wan 2.5 预览

它灵活的尺寸支持和高质量的输出使其成为创意应用程序、营销工具、内容管理系统和设计软件的理想选择。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'alibaba/wan2.5-t2i-preview',
      prompt: 'A jellyfish in the ocean',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "alibaba/wan2.5-t2i-preview",
            "prompt": "A jellyfish in the ocean",
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()

Docs

300 多个适用于 OpenClaw 和 AI 代理的 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

Wan 2.5 预览

产品详情

✨ Wan 2.5 预览 这款产品代表了文本转图像生成技术的尖端水平，是在广受好评的 Wan 系列基础上打造而成。此次迭代引入了多项重大改进，主要体现在取消了之前对图像边长的限制，使用户能够在限定的像素区域内灵活选择像素尺寸。它巧妙地融合了先进的 AI 架构和精细的像素级控制，能够根据简单的文本提示生成丰富多样、细节丰富且高度逼真的图像。

🔧 技术规格

型号： 文本到图像生成模型
建筑学： 先进的基于扩散的生成网络
输入： 自然语言文本提示
输出： 可变分辨率图像，任意尺寸在支持的像素范围内
训练数据： 包含艺术作品、照片和数字插图等多种模态的多元化数据集
支持的语言： 主要英语可通过分词适应其他语言

📈 性能基准测试

FID 分数（Fréchet 起始距离）： 13.5 在标准图像生成基准测试中，显示出较高的真实感和质量。
推理速度： 平均世代时间 4秒在现代GPU上，每张512x512图像的处理速度。
内存使用情况： 针对以下平台进行了优化： 12GB及以上 GPU显存配置。
分辨率支持： 成功生成图像，最高可达 4K及以上分辨率 质量不下降。
多样性： 针对同一提示生成各种独特的图像，支持创意探索。

💲 API 定价

仅有的 每张图片 0.0315 美元

🔑 主要功能

高质量细节： 生产 清晰而精细的图像特征 涵盖各种风格和主题。
灵活的风格适应性： 能够根据提示语境生成艺术性、写实性或风格化的图像。
快速推理： 高效的模型设计能够 更快的图像生成 与之前的版本相比。
可扩展分辨率： 适用于小型数字缩略图，最大尺寸为 大型印刷品和演示文稿。

🚀 应用案例

数字艺术创作： 非常适合需要定制任何尺寸和风格的艺术作品的艺术家。
市场营销与广告： 快速制作符合宣传活动需求的高质量视觉素材。
内容生成： 用独特的图片提升博客、社交媒体和网站的吸引力。
原型制作与设计： 在早期开发阶段生成概念图和产品视觉图。
教育材料： 为教学资源创作引人入胜的插图或信息图。
娱乐与媒体： 可用于故事板绘制、角色概念设计以及视觉特效素材制作。

💻 代码示例

🔄 与其他型号的比较

与稳定扩散相比： Wan 2.5 针对以下方面进行了优化 高分辨率图像和快速推理 并且在大尺寸下质量始终如一，而稳定扩散在放大时有时会出现质量下降。

vs DALL·E 3： Wan 2.5 预览版提供 灵活的尺寸控制 使用户能够自由调整输出尺寸，这对于专业的设计和印刷应用来说尤其有利。

对阵 Midjourney： Wan 2.5 Preview 在尺寸自定义方面更加灵活，支持快速生成风格化和照片级写实输出，吸引了有此需求的用户。 尺寸灵活，细节不减。

对比图像： Wan 2.5 Preview 通过允许超越 Imagen 可自由选择图像尺寸 在像素面积限制内，为各种使用场景和可直接打印的结果提供了更大的适应性。

💭 常见问题解答 (FAQ)

什么是 Wan 2.5 预览版？

Wan 2.5 Preview 是 Wan 系列文本转图像模型的最新版本，该系列模型以其能够根据文本提示生成高保真图像而闻名。其主要创新之处在于取消了之前对图像边长的限制，从而在定义的像素区域内提供了灵活且不受限制的像素尺寸选择。

Wan 2.5 Preview 与其他主流型号相比如何？

Wan 2.5 Preview 的突出之处在于其针对高分辨率图像的优化、快速推理以及在大尺寸下始终如一的质量，解决了 Stable Diffusion 在缩放时有时会出现的质量下降问题。与 DALL·E 3、Midjourney 和 Imagen 相比，Wan 2.5 提供更灵活的尺寸控制，使其在专业设计、印刷应用和多样化的输出定制方面极具优势，且不会牺牲细节。

Wan 2.5 Preview 的主要使用场景是什么？

它非常适合各种应用，包括数字艺术创作、营销和广告视觉效果、博客和社交媒体的一般内容生成、原型制作和设计、教育材料以及娱乐和媒体制作，如故事板和视觉特效。

Wan 2.5 Preview 的 API 定价是多少？

Wan 2.5 Preview 的 API 定价为每生成一张图像 0.0315 美元，价格非常实惠。

Wan 2.5 Preview 的关键性能指标是什么？

它拥有13.5的FID评分（高质量），平均推理速度为每张512x512图像4秒，针对12GB以上的GPU显存进行了内存优化，并支持高达4K及以上的分辨率而不会降低图像质量。此外，它还能针对同一提示生成多种不同的图像。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

300 多个 AI 模型
OpenClaw 和人工智能代理

节省20%的费用