



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/wan2.2-vace-fun-a14b-pose',
prompt: 'Mona Lisa puts on glasses with her hands.',
video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
resolution: "720p",
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "alibaba/wan2.2-vace-fun-a14b-pose",
"prompt": "Mona Lisa puts on glasses with her hands.",
"video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
"resolution": "720p",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

产品详情
模型概述
Wan 2.2 VACE Pose 是由 Wan Labs 利用创新技术开发的高级视频生成模型。 VACE(视频自适应合成编辑) 该技术专注于可控视频合成,并提供精细的参数支持,例如: Canny边缘检测, 深度图, 安装估价, MLSD(线段检测)等等。该模型赋予创作者更强的视频内容生成控制权,能够制作出高质量、连贯流畅的视频序列,非常适合专业和创意应用。
技术规格
性能基准
- ✔ 可生成高质量的电影级视频序列,具有流畅的运动过渡和稳定、无闪烁的输出。
- ✔ 与以往相比,时间一致性和语义准确性均显著提高。 Wan 2.1 型号。
- ✔ 高效的内存利用和优化的VAE压缩技术可实现更快的生成速度。
- ✔ 现代GPU(例如,GPU-3)支持实时视频编辑和生成工作流程 RTX 4090)。
- ✔ 在处理涉及多个角色和摄像机运动的复杂动态场景方面,性能优于早期版本。
- ✔ 卓越的精细控制,可实现精确的创意指导(灯光、构图、运动)。
主要特点
- ★ 高级视频控制: 支持 Canny、深度、姿态、MLSD 地图以及用于精细视频内容操控的轨迹参数。
- ★ 支持多分辨率: 高效生成视频 512、768 和 1024 像素分辨率。
- ★ 时间帧处理: 训练序列 81帧,帧率为16帧/秒 用于生成流畅、连贯的视频。
- ★ 多语言输入支持: 启用带提示的视频生成功能 多语言。
- ★ 生成灵活性: 能够 特定主题视频生成 使用定制的控制输入。
- ★ 开放且可扩展: 完全 开源模型权重和工作流程 可供定制和集成。
- ★ 稳定的相机控制: 支持视频编辑,具备稳定的相机镜头控制和复杂的运动路径。
API定价
💲 360p: 0.0525美元
💲 540p: 0.07875美元
💲 720p: 0.105美元
用例
- ➤ 专业视频制作和动画,具备精准的姿势和动作控制能力。
- ➤ 电影化叙事和概念视频创作。
- ➤ 具有更高稳定性和视觉连贯性的数字艺术动画。
- ➤ 适用于电影、广告和多媒体项目的实时合成编辑。
- ➤ 利用多模态输入触发器生成交互式视频内容。
代码示例
与其他型号的比较
▶ 与 Veo 3.0 对比: Veo 3.0 专注于快速将文本转换为视频,具有高效的渲染速度,但对空间视频元素的直接控制有限。 Wan 2.2 VACE Fun A14B Pose虽然速度较慢且占用更多显存,但它能够进行精细的视频编辑和精确的运动处理,因此更适合高质量的制作工作流程。
▶ 对阵 KLING 2.0: 两款机型均提供先进的视频生成功能,并采用开源代码库。 它们是 2.2 VACE VACE 2.0 在多条件输入(姿态、深度、Canny 边缘)的自适应合成编辑方面表现出色,而 KLING 2.0 在原始视频质量方面与之匹敌,但缺乏 VACE 2.0 中存在的精细可编辑控制。
▶ vs Wan 2.1 VACE: Wan 2.2 VACE Fun A14B Pose 与 Wan 2.1 VACE 相比,该版本在时间一致性和视觉保真度方面均有所提升,尤其是在涉及多个运动对象的复杂场景中。它能更有效地减少面部和姿态表示中的身份损失,并支持更高的原生分辨率(最高可达 1080p)。
API集成
可通过人工智能/机器学习 API 访问。文档: 🔗 Wan 2.2 VACE API 参考
常见问题解答 (FAQ)
❓ 什么是 Wan 2.2 Vace Fun A14B 姿势?它有哪些独特之处,使其适用于角色摆姿?
Wan 2.2 Vace Fun A14B Pose 是一款专注于生成和操控角色姿势的专业人工智能模型,它兼具创意和解剖学上的精准性。其独特之处在于能够理解人类和生物的解剖结构,生成动态且富有表现力的姿势,并在探索各种站姿、手势和动作的同时保持角色的一致性。“Vace Fun”特性确保了这些姿势引人入胜、注重故事叙述且具有视觉吸引力。
❓ 该模型最能有效地生成哪些类型的姿势和手势?
该模型擅长生成:动态动作姿势(战斗、运动、舞蹈)、富有表现力的情感手势和肢体语言、自然的休息和休闲姿势、风格化的卡通和动漫姿势、生物和动物的姿态、交互式多角色组合,以及展现动作进程的姿势序列。它能够理解重量分布、平衡和解剖结构限制,从而创造出逼真且极具视觉吸引力的姿势。
❓ “趣味性”因素如何影响姿势生成?
“趣味性”这一要素将姿势生成从技术定位转变为富有表现力的叙事,具体体现在:创造具有个性和特色的姿势,呈现动感十足且引人入胜的构图,在适当的时候添加奇思妙想或夸张的元素,保持动感和活力,并确保姿势服务于叙事目的,而不仅仅是解剖结构的正确性。这使得生成的姿势更适合动画、插画和角色设计。
❓人工智能姿态生成技术有哪些实际应用?
实际应用包括:角色设计和概念艺术、动画关键帧创建、故事板和漫画分镜开发、游戏角色姿势、艺术家参考图像生成、时尚和产品姿势设计、教学解剖演示以及社交媒体内容创作。对于需要快速获取姿势参考或角色表情灵感的艺术家和创作者来说,它尤其有价值。
❓哪些技术能产生最佳的姿态生成结果?
最佳效果来自于:清晰描述角色的情绪或动作,明确姿势风格(写实、卡通、动漫),标明拍摄角度和视角,描述重心分布和平衡点,提及任何道具或环境互动,并提供角色性格方面的背景信息。例如:“超级英雄落地姿势,低角度拍摄,披风飘扬,充满动感,表情自信,符合人体比例,略带风格化的夸张。”



登录