qwen-bg
max-ico04
出去
max-ico02
聊天
max-ico03
禁用
Wan 2.2 真空外漆
它以保持时间流畅性和空间细节的能力而脱颖而出,成为寻求高级场景扩展功能的视频创作者和开发人员的首选。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'alibaba/wan2.2-vace-fun-a14b-outpainting',
      prompt: 'Mona Lisa puts on glasses with her hands.',
      video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
      image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
      resolution: "720p",
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "alibaba/wan2.2-vace-fun-a14b-outpainting",
        "prompt": "Mona Lisa puts on glasses with her hands.",
        "video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
        "image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
        "resolution": "720p",
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
  • ico01-1
    API 操练场(Playground)

    在集成之前,请在沙箱环境中测试所有 API 模型。

    我们提供 300 多种模型供您集成到您的应用程序中。

    复制图片02图片01
qwenmax-bg
图片
Wan 2.2 真空外漆

产品详情

Wan 2.2 VACE 外漆 是一款先进的视频到视频人工智能模型,旨在将视频帧无缝扩展到其原始边界之外。这一创新解决方案可生成与输入视频完美协调的额外场景内容,提供无与伦比的创意视频外绘功能。用户可从中受益。 灵活控制内容风格、运动连续性和分辨率质量使其成为功能强大的 Wan VACE 系列视频合成和编辑任务的关键组件。

⚙️ 技术规格

  • 模型架构: Wan 2.2 VACE Fun A14B,基于先进的视频生成和扩散网络,采用 VACE 架构。
  • 输入类型: 支持多种编码选项的视频文件或URL。
  • 输出分辨率: 灵活的选项包括 480p、580p、720p 以及最高可达 4K
  • 视频帧速率: 标准帧率为 16 FPS;可支持更高的帧率,实现更流畅的播放。
  • 内存与性能: 针对 GPU 执行进行了优化,并提供适用于以下情况的模型变体: 8 GB 显存的 GPU
  • 最大视频长度: 有效地 无限长度能力 同时保持时间上的一致性。
  • 训练数据: 使用包含多种条件控制的大量视频数据集进行训练,以获得稳健且用途广泛的输出。

性能基准

  • 一流的品质: 因其输出保真度,一直位列领先的开源视频生成模型之列。
  • 时间一致性: 保持 流畅的动作和视觉一致性 在扩展帧范围内,这对逼真的视频至关重要。
  • 分辨率保真度: 实现 细节保留度高 在空间和时间维度上,甚至超越了初始框架边界。
  • 效率: 提供实时或接近实时的标准高清视频处理生成速度,从而提高工作效率。
  • 兼容性: 即使在配备标准 8GB 显存的消费级 GPU 上也能高效运行,因此可供更广泛的用户群体使用。

主要特点

  • 视频外绘: 在保持视觉连贯性和时间结构的同时,用新的、与上下文相关的内容扩展视频帧。
  • 高分辨率输出: 支持高达 4K分辨率输出 画面过渡极其流畅。
  • 灵活输入: 支持多种视频格式,包括 MP4、MOV、WEBM、M4V 和 GIF,确保广泛的兼容性。
  • 最佳帧速率: 以每秒 16 帧或更高的帧率处理视频,确保流畅逼真的动作。
  • 高级控制条件: 支持详细的控制输入,例如姿态、深度、边缘(Canny)、MLSD 和轨迹控制。 精准的内容生成
  • 多语言支持: 旨在适应多种语言输入,便于全球应用和访问。

💲 API定价

  • 360p: 0.0525美元
  • 540p: 0.07875美元
  • 720p: 0.105美元

💡 用例

  • 创意视频外绘,用于扩展电影场景,增强叙事深度。
  • 在后期制作工作流程中增强视觉特效,简化复杂场景的扩展。
  • 为沉浸式 VR/AR 体验生成扩展的视频环境。
  • 通过增加视觉背景来增强视频叙事,提供更丰富的故事情节。
  • 高效生成用于广告和社交媒体的视频内容,并能将内容调整为各种宽高比。

💻 代码示例

(此区域为使用 `alibaba/wan2.2-vace-fun-a14b-outpainting` 模型实现的 `alibaba.create-video-to-video-generation` 的动态代码片段占位符。)

⚖️ 与其他领先型号的比较

Wan 2.2 VACE Outpainting vs. Qwen 视频:

他们 2.2 擅长 照片级写实视频后期处理 具备精细的多条件控制(姿态、深度、轨迹),可实现精确的场景扩展。相比之下, Qwen 视频 这些模型通常侧重于艺术化和风格化的生成,在动画或创意风格方面往往表现出色,但对照片级真实感和时间流畅性则关注较少。因此,Wan 2.2 是处理长视频序列时,追求始终如一的真实感和流畅度的更佳选择。

Wan 2.2 VACE Outpainting 对比 KLING 2.0:

尽管 KLING 2.0 提供具有竞争力的视频生成质量 他们 2.2 通过整合一个 混合专首页(MoE)架构这项创新技术在提升视频细节和运动连贯性的同时,将计算需求降低了约 50%。此外,WAN 2.2 还提供了更灵活的控制参数,可实现更精细的场景和运动操控,使其成为专业和商业视频合成任务的理想之选。

Wan 2.2 VACE Outpainting vs. Haiulo 02:

2002年秋季 它以流畅的基本视频合成功能而闻名,但缺乏高级的条件控制和高分辨率图像渲染功能。 他们 2.2 Wan 2.2 提供强大的支持。它能够处理复杂的群组运动和精细的 CGI 特效,这使其在电影级视频扩展应用场景中比 Haiulo 02 的简单工作流程更具优势。

Wan 2.2 VACE Outpainting 对比 Veo 3:

我看到3 主要侧重于快速视频生成,较少关注画面渲染质量和精细控制,更侧重于快速内容创作。相比之下, 他们 2.2 巧妙地平衡了速度和保真度,呈现出卓越的效果。 高分辨率、时间一致的图像外绘 它具备 Veo 3 目前所缺乏的灵活控制输入。

🔗 API集成

Wan 2.2 VACE Outpainting 可通过 AI/ML API 轻松访问。完整的文档如下: 此处提供 面向开发者。

常见问题解答 (FAQ)

问:什么是 Wan 2.2 VACE Outpainting?

A:Wan 2.2 VACE Outpainting 是一种先进的 AI 模型,它通过在视频帧的原始边界之外生成新的、与上下文相关的内容来扩展视频帧,从而确保无缝的视觉和时间连续性。

问:WAN 2.2 如何实现高时间一致性?

答:它采用复杂的 VACE 架构和多条件控制,并在大规模视频数据集上进行训练,以在所有扩展帧中保持流畅的运动和一致的视觉效果。

问:我可以控制后期制作视频的风格和内容吗?

答:是的,Wan 2.2 提供了对内容风格的灵活控制,并支持姿态、深度、边缘(Canny)、MLSD 和轨迹等详细控制输入,以实现精确生成。

问:使用 Wan 2.2 进行视频外绘的主要优势是什么?

答:主要优势包括高分辨率输出(最高可达 4K)、先进的时间一致性、高效的 GPU 性能、支持无限的视频长度,以及针对各种用例(如电影扩展和 VR/AR 内容)的多功能创意控制。

了解如何利用 AICC API 实现公司转型

探索如何利用 AICC API 革新您的业务!解锁强大的工具,实现流程自动化、增强决策能力并打造个性化的客户体验。
联系销售
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用