



const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/wan2.5-t2i-preview',
prompt: 'A jellyfish in the ocean',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "alibaba/wan2.5-t2i-preview",
"prompt": "A jellyfish in the ocean",
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

产品详情
✨ Wan 2.5 预览 这款产品代表了文本转图像生成技术的尖端水平,是在广受好评的 Wan 系列基础上打造而成。此次迭代引入了多项重大改进,主要体现在取消了之前对图像边长的限制,使用户能够在限定的像素区域内灵活选择像素尺寸。它巧妙地融合了先进的 AI 架构和精细的像素级控制,能够根据简单的文本提示生成丰富多样、细节丰富且高度逼真的图像。
🔧 技术规格
- 型号: 文本到图像生成模型
- 建筑学: 先进的基于扩散的生成网络
- 输入: 自然语言文本提示
- 输出: 可变分辨率图像,任意尺寸在支持的像素范围内
- 训练数据: 包含艺术作品、照片和数字插图等多种模态的多元化数据集
- 支持的语言: 主要 英语可通过分词适应其他语言
📈 性能基准测试
- FID 分数(Fréchet 起始距离): 13.5 在标准图像生成基准测试中,显示出较高的真实感和质量。
- 推理速度: 平均世代时间 4秒 在现代GPU上,每张512x512图像的处理速度。
- 内存使用情况: 针对以下平台进行了优化: 12GB及以上 GPU显存配置。
- 分辨率支持: 成功生成图像,最高可达 4K及以上分辨率 质量不下降。
- 多样性: 针对同一提示生成各种独特的图像,支持创意探索。
💲 API 定价
仅有的 每张图片 0.0315 美元
🔑 主要功能
- 高质量细节: 生产 清晰而精细的图像特征 涵盖各种风格和主题。
- 灵活的风格适应性: 能够根据提示语境生成艺术性、写实性或风格化的图像。
- 快速推理: 高效的模型设计能够 更快的图像生成 与之前的版本相比。
- 可扩展分辨率: 适用于小型数字缩略图,最大尺寸为 大型印刷品和演示文稿。
🚀 应用案例
- 数字艺术创作: 非常适合需要定制任何尺寸和风格的艺术作品的艺术家。
- 市场营销与广告: 快速制作符合宣传活动需求的高质量视觉素材。
- 内容生成: 用独特的图片提升博客、社交媒体和网站的吸引力。
- 原型制作与设计: 在早期开发阶段生成概念图和产品视觉图。
- 教育材料: 为教学资源创作引人入胜的插图或信息图。
- 娱乐与媒体: 可用于故事板绘制、角色概念设计以及视觉特效素材制作。
💻 代码示例
🔄 与其他型号的比较
与稳定扩散相比: Wan 2.5 针对以下方面进行了优化 高分辨率图像和快速推理 并且在大尺寸下质量始终如一,而稳定扩散在放大时有时会出现质量下降。
vs DALL·E 3: Wan 2.5 预览版提供 灵活的尺寸控制 使用户能够自由调整输出尺寸,这对于专业的设计和印刷应用来说尤其有利。
对阵 Midjourney: Wan 2.5 Preview 在尺寸自定义方面更加灵活,支持快速生成风格化和照片级写实输出,吸引了有此需求的用户。 尺寸灵活,细节不减。
对比图像: Wan 2.5 Preview 通过允许超越 Imagen 可自由选择图像尺寸 在像素面积限制内,为各种使用场景和可直接打印的结果提供了更大的适应性。
💭 常见问题解答 (FAQ)
什么是 Wan 2.5 预览版?
Wan 2.5 Preview 是 Wan 系列文本转图像模型的最新版本,该系列模型以其能够根据文本提示生成高保真图像而闻名。其主要创新之处在于取消了之前对图像边长的限制,从而在定义的像素区域内提供了灵活且不受限制的像素尺寸选择。
Wan 2.5 Preview 与其他主流型号相比如何?
Wan 2.5 Preview 的突出之处在于其针对高分辨率图像的优化、快速推理以及在大尺寸下始终如一的质量,解决了 Stable Diffusion 在缩放时有时会出现的质量下降问题。与 DALL·E 3、Midjourney 和 Imagen 相比,Wan 2.5 提供更灵活的尺寸控制,使其在专业设计、印刷应用和多样化的输出定制方面极具优势,且不会牺牲细节。
Wan 2.5 Preview 的主要使用场景是什么?
它非常适合各种应用,包括数字艺术创作、营销和广告视觉效果、博客和社交媒体的一般内容生成、原型制作和设计、教育材料以及娱乐和媒体制作,如故事板和视觉特效。
Wan 2.5 Preview 的 API 定价是多少?
Wan 2.5 Preview 的 API 定价为每生成一张图像 0.0315 美元,价格非常实惠。
Wan 2.5 Preview 的关键性能指标是什么?
它拥有13.5的FID评分(高质量),平均推理速度为每张512x512图像4秒,针对12GB以上的GPU显存进行了内存优化,并支持高达4K及以上的分辨率而不会降低图像质量。此外,它还能针对同一提示生成多种不同的图像。



登录