在

出去

聊天

禁用

Wan 2.2 Vace 深度

其先进的架构能够实现高分辨率、多帧视频，并具有自然的景深效果和流畅的运动。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'alibaba/wan2.2-vace-fun-a14b-depth',
      prompt: 'Mona Lisa puts on glasses with her hands.',
      video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
      image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
      resolution: "720p",
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "alibaba/wan2.2-vace-fun-a14b-depth",
        "prompt": "Mona Lisa puts on glasses with her hands.",
        "video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
        "image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
        "resolution": "720p",
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()

Docs

300 多个适用于 OpenClaw 和 AI 代理的 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

Wan 2.2 Vace 深度

产品详情

Wan 2.2 VACE Depth 是一款尖端的视频到视频生成模型，经过精心优化，适用于 深度图控制作为 Wan 2.2 VACE Fun A14B 系列的重要成员，该型号采用先进的多模态视频合成技术，可生成高质量、具有深度感知的视频输出。其在深度处理方面的专长提供了无与伦比的性能。 空间深度控制提升视频真实感，实现动态视觉效果。

● 主要功能和特性

✓ 深度可控生成： 专注于利用深度图，以精确的空间感知来指导视频创作。
✓ 支持多分辨率： 可生成 512、768 和 1024 像素的视频，满足各种不同的制作需求。
✓ 流畅的动作和顺滑的体验： 采用每秒 16 帧 (FPS) 的 81 帧进行训练，确保动作异常流畅自然。
✓ 全球可访问性： 支持多种语言，具有广泛的全球可用性。
✓ 学科深度： 通过指定具有一致深度的场景理解的主题，促进视频生成。
✓ 广泛的输入兼容性： 兼容多种视频输入格式，包括 MP4、MOV、WebM、M4V 和 GIF。

● 技术规格

💻 模特尺寸： 约 64 GB
🔧 建筑： 基于 Wan 2.2-T2V-A14B 基础模型，集成 VACE 方案
⏰ 帧率： 以 16 帧/秒的速度输出视频。
📈 视频时长： 每次推理最多 81 帧
🔗 输入类型： 可接受原始视频或深度图输入，以实现精确控制

● 性能基准测试

✓ 演示 高保真视频预测 深度一致性稳定。
✓ 最大程度减少常见的视频生成瑕疵，如抖动和场景不一致。
✓ 生产 电影级运动 增强了空间深度线索。
✓ 针对多种分辨率和格式的流畅视频生成进行了优化。

● 应用案例

🎬 运用精准的深度渲染技术进行电影级视频制作。
🔍 电影制作中的预可视化和概念视频生成。
🎨 需要空间深度和场景稳定性的数字艺术动画。
💰 利用深度线索增强真实感的商业视频特效。
📜 多模态视频合成的研究与开发。

● API 集成与定价

通过 AI/ML API 无缝访问 Wan 2.2 VACE 深度功能。定价按输出分辨率划分：

💵 360p： 0.0525美元
💵 540p： 0.07875美元
💵 720p： 0.105美元

API集成的完整文档是此处提供。

● 代码示例

● 与其他领先型号的比较

Wan 2.2 深度 vs. KLING 2.0

Wan 2.2 Depth 利用混合专家架构，并着重强调 精确的深度图控制 用于生成空间连贯的视频。相比之下，KLING 2.0 提供更广泛的视频合成功能，但深度驱动的运动控制不够明确。Wan 2.2 提供 优异的时间稳定性和场景一致性 分辨率最高可达 1080p。

Wan 2.2 深度 vs. 我看到3

Veo 3 针对快速实时视频合成进行了优化，通常为了提高速度而侧重于较低的分辨率（例如 720p）。然而，WAN 2.2 深度优先考虑…… 具有电影级画质、精细的景深处理和强大的帧连贯性通过增加计算资源来提供更高质量的输出。

Wan 2.2 深度对比 Wan 2.1 VACE

Wan 2.2 深度代表着一项重大进步，显著提升了性能。 视频流畅度、运动真实感和深度精度 通过升级后的架构，WAN 2.1 VACE 的专业化程度较低，输出稳定性也较差，尤其是在复杂的场景生成场景中。

● 常见问题解答 (FAQ)

问：Wan 2.2 VACE深度的主要优势是什么？

答：它的主要优势在于对视频生成拥有无与伦比的控制力。 深度图从而实现精确的空间感知和增强输出的真实感。

问：WAN 2.2 VACE Depth 能否生成高分辨率视频？

答：是的，它支持多分辨率视频预测，包括 512、768 和 1024 像素满足各种质量要求。

问：它如何确保视频运动流畅？

答：该模型使用 81 帧/秒、16 FPS 的帧进行训练，这是生成模型的基础。 流畅、顺滑且具有电影质感的运动 在其生成的视频中。

问：它接受哪些类型的视频输入？

答：它具有很高的兼容性，可接受多种视频输入类型，例如： MP4、MOV、WebM、M4V 和 GIF。

问：Wan 2.2 VACE Deep 是否适合专业电影制作？

答：当然。它精准的深度渲染、电影级的动态效果以及最大限度减少生成伪影的能力，使其成为理想之选。 电影视频制作和前期可视化。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

300 多个 AI 模型
OpenClaw 和人工智能代理

节省20%的费用