qwen-bg
max-ico04
出去
max-ico02
聊天
max-ico03
积极的
Kling 视频 O1 参考视频
它采用先进的特征提取技术,在全新的场景和动作中保留视觉特征,例如外观、纹理和风格。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'klingai/video-o1-reference-to-video',
      prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
      image_list: [
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
      ],
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "klingai/video-o1-reference-to-video",
        "prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
        "image_list": [
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
        ]
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
qwenmax-bg
图片
Kling 视频 O1 参考视频

产品详情

🚀 Kling Video O1 API:突破性的参考视频生成技术

Kuaishou's Kling 视频 O1 参考视频 它能够直接从图像参考生成与主题高度一致的视频,效果无与伦比。这种统一的多模态模型利用先进的特征提取技术,在各种全新场景中完美保留角色、道具和场景的特征,为人工智能驱动的视频创作树立了新的标杆。

⚙️ 技术规格

  • 输入支持: 可接受单个或多个参考图像(每个元素最多 4 个视角),格式为 JPG、JPEG 或 PNG。也支持可选的视频参考,时长不超过 10 秒,文件大小不超过 200MB,分辨率不超过 2K。
  • 输出能力: 可生成时长5至10秒、分辨率最高可达2K(1080p标准)、帧速率为30帧/秒的视频。完全支持包括16:9在内的常见宽高比。
  • 模型架构: 基于强大的统一多模态引擎构建,该引擎融合了 思维链(CoT)推理多元素融合和复杂的视觉语言处理,可实现精确的身份保留和深入的上下文理解。

📈 性能基准测试

Kling Video O1 在身份一致性和运动质量方面均表现出色,在关键的参考生成任务中超越了竞争对手:

  • ✅ 展示了 提升247% 在参考文献生成任务中与 Google Veo 3.1
  • ✅ 已达成 提升230% 超过 Runway Aleph 在类似的基准测试中。
  • ✨ 具有卓越的画面稳定性,有效减少复杂多主体场景中的闪烁。
  • 🧠 通过 CoT 增强推理,在渲染之前智能地分析输入,从而显著提高提示准确率。
Kling Video O1 性能对比

🌟 Kling Video O1 的主要功能

  • 🖼️ 多参考主题构建: 从不同视角提取全面特征,确保动态场景中主体身份的高度稳定性和一致性。
  • 🌍 新场景生成: 能够创建完全新颖独特的内容,例如未来主义的角色行走或复杂的互动,同时严格保留参考细节。
  • 🎛️ 专业/标准模式: 提供灵活的模式以平衡质量和速度,同时提供对高级相机控制、精确运动精度和逼真物理模拟的强大支持。
  • 一体化参考文献处理: 无缝融合多个主题(角色、道具和整个场景),生成复杂、连贯且高质量的视频输出。

💲 Kling Video O1 API 定价

Kling Video O1 API 的定价极具竞争力:

  • 每秒 0.1176 美元 生成的视频

💻 代码示例

以下是如何集成 Kling Video O1 API 的示例:

与领先人工智能模型的比较

在竞争激烈的AI视频生成领域,Kling Video O1脱颖而出:

  • 🆚 与 Google Veo 3.1 相比: Kling O1 在参考保真度方面比 Veo 3.1 提升了惊人的 247%,并能提供卓越的多视角融合,且不会损失相干性。Veo 在处理复杂的主体交互时常常表现出局限性。
  • 🆚 对比 Runway Gen-4.5: Kling 在各个角度都能提供卓越的标识保持性,使其成为实现专业级一致性的理想选择。Runway Gen-4.5 更侧重于文本驱动的动态效果,但在整合多个参考输入时稳定性较差。
  • 🆚 vs. 海罗 2.3: Kling 先进的“思维链”推理技术确保了更流畅的物理效果和镜头运动,从而带来更高的视频质量和更自然的运动效果。海罗 2.3 在视频生成速度方面可能表现出色,但在保持较长视频片段的拍摄对象稳定性方面通常略逊一筹。

❓ 常见问题解答 (FAQ)

Kling Video O1 参考视频是什么?

Kling Video O1 是快手推出的统一多模态 AI 模型,即使在新的场景中,也能直接从图像参考生成具有一致主题、道具和场景的视频。

Kling Video O1 支持哪些主要输入类型?

它主要接受单个或多个参考图像(JPG、JPEG、PNG),每个元素最多可有 4 个视角,还可以选择接受最长 10 秒、最大 200MB、分辨率为 2K 的视频参考。

Kling Video O1 生成的视频时长是多少?分辨率是多少?

生成的视频通常为 5-10 秒,标准分辨率为 1080p,最高可达 2K,帧速率为每秒 30 帧。

Kling Video O1 在身份一致性方面有哪些优势?

其统一的多模态引擎,结合思维链(CoT)推理、多元素融合和视觉语言处理,确保在复杂场景中实现精确稳定的身份保留。

使用 Kling Video O1 API 的费用是多少?

Kling Video O1 API 的定价为每秒生成视频内容 0.1176 美元。

API 操练场(Playground)

集成前,请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。
免费试用
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用