

在
出去


Text to Speech
const main = async () => {
const response = await fetch('https://api.ai.cc/v2/generate/video/alibaba/generation', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/wan2.1-t2v-plus',
prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
aspect_ratio: '16:9',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/generate/video/alibaba/generation"
payload = {
"model": "alibaba/wan2.1-t2v-plus",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
"aspect_ratio": "16:9",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

产品详情
阿里巴巴的WAN2.1 Plus代表着一次重大飞跃 文本转视频生成这款产品旨在以无与伦比的精度和效率生成高质量的电影级视频输出。这款先进的人工智能模型利用复杂的多模态理解能力,将复杂的文本提示无缝转化为视觉连贯且动态的视频。它尤其擅长大规模视频合成,能够对运动动态和场景构图进行精细控制,使其成为创意和专业应用中不可或缺的工具。
✨ 主要特性和技术规格
- ✔️视频生成质量: 在动态动作、细致的面部表情和复杂的物体交互方面,都能呈现高保真度的效果,确保专业级的输出。
- 🧠 多步骤推理: 具备对复杂提示的深刻理解,能够进行复杂的视频合成,完美契合用户意图。
- 🎯 遵循以下说明: 在所有生成的视频内容中,对用户提示的遵循度更高,并保持了物理真实性。
- 🎬 文本转视频合成: 可直接从自然语言描述轻松生成流畅、上下文准确的视频。
- 🖼️ 多模态场景理解: 整合场景布局、色彩、光照和运动,打造真正具有电影感和沉浸感的视觉效果。
- ⚙️ 精细控制: 支持对美学参数进行详细的基于提示的调整,包括对光照、相机角度和色调的精确调整。
💰 API 定价
仅有的 0.525美元 视频
💡 最佳使用场景
- 🎥创意内容制作: 非常适合需要从文本生成高清视频输出的电影制作、广告和故事板工作流程。
- 📚 视觉叙事: 将文字叙述转化为动态、细节丰富的视觉效果,以前所未有的轻松方式让故事栩栩如生。
- 🎮 互动媒体与娱乐: 便于根据脚本或对话输入快速开发游戏和互动体验的视觉素材。
- 📈 商业演示与营销: 能够生成定制化的视频内容,显著增强在商业环境中的沟通效果。
代码示例
⚖️ 与其他型号的比较
- 对比 Wan2.2-T2V: Wan2.1-T2V-Plus 提供可靠的性能,专注于经济高效的 1080P 视频生成,而 Wan2.2 则通过更大的参数模型和多专家架构提供更先进的功能,以实现更佳的美观性和效率。
- 对比 双子座 2.5 闪光灯: Wan2.1 提供具有竞争力的文本转视频功能,对于以成本效益为主要考虑因素的 1080P 生成任务来说,尤其具有价值。
- 对比 OpenAI GPT-4 视觉: Wan2.1 特别强调从文本合成专用视频,并提供强大的高分辨率定价支持,这与 GPT-4 更广泛的多模态对话优势形成对比。
⚠️ 限制
- 次要文物: 生成的视频可能存在一些轻微的瑕疵或不一致之处,尤其是在提示信息非常复杂的情况下。虽然高级调整可以减轻这些问题,但并不能保证完全消除。
- 视频时长: 目前主要针对 5 秒视频片段进行了优化。生成更长的视频可能需要额外的处理步骤或资源。
❓ 常见问题解答 (FAQ)
问:阿里巴巴WAN2.1 Plus的主要设计用途是什么?
答:阿里巴巴 Wan2.1 Plus 是一款先进的 AI 模型,专为高质量、电影级的文本转视频生成而设计,擅长将文本提示转换为视觉上连贯的视频输出。
问:WAN2.1 Plus 对视频生成提供了哪些控制?
答:它能够对美学参数进行精细控制,允许根据提示对照明、摄像机角度和色调进行详细调整,以达到所需的电影效果。
问:与其他型号相比,它的价格如何?
答:Wan2.1 Plus 提供极具竞争力的价格,每个视频 0.525 美元,与一些更广泛的多模态 AI 模型相比,它对于对成本敏感的 1080P 视频生成任务来说尤其有价值。
问:WAN2.1 Plus 的主要局限性是什么?
答:主要限制包括:复杂提示可能出现轻微瑕疵,以及目前主要针对 5 秒视频片段的优化,对于更长的视频片段需要额外的处理。
问:WAN2.1 Plus 在哪些行业可以得到最佳应用?
答:它最适用于创意内容制作(电影制作、广告)、视觉叙事、互动媒体和娱乐,以及增强商业演示和营销。



登录