

在
出去


Text to Speech
const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'klingai/video-o1-reference-to-video',
prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
image_list: [
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
],
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "klingai/video-o1-reference-to-video",
"prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
"image_list": [
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
]
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

产品详情
🚀 Kling Video O1 API:突破性的参考视频生成技术
Kuaishou's Kling 视频 O1 参考视频 它能够直接从图像参考生成与主题高度一致的视频,效果无与伦比。这种统一的多模态模型利用先进的特征提取技术,在各种全新场景中完美保留角色、道具和场景的特征,为人工智能驱动的视频创作树立了新的标杆。
⚙️ 技术规格
- 输入支持: 可接受单个或多个参考图像(每个元素最多 4 个视角),格式为 JPG、JPEG 或 PNG。也支持可选的视频参考,时长不超过 10 秒,文件大小不超过 200MB,分辨率不超过 2K。
- 输出能力: 可生成时长5至10秒、分辨率最高可达2K(1080p标准)、帧速率为30帧/秒的视频。完全支持包括16:9在内的常见宽高比。
- 模型架构: 基于强大的统一多模态引擎构建,该引擎融合了 思维链(CoT)推理多元素融合和复杂的视觉语言处理,可实现精确的身份保留和深入的上下文理解。
📈 性能基准测试
Kling Video O1 在身份一致性和运动质量方面均表现出色,在关键的参考生成任务中超越了竞争对手:
- ✅ 展示了 提升247% 在参考文献生成任务中与 Google Veo 3.1。
- ✅ 已达成 提升230% 超过 Runway Aleph 在类似的基准测试中。
- ✨ 具有卓越的画面稳定性,有效减少复杂多主体场景中的闪烁。
- 🧠 通过 CoT 增强推理,在渲染之前智能地分析输入,从而显著提高提示准确率。
🌟 Kling Video O1 的主要功能
- 🖼️ 多参考主题构建: 从不同视角提取全面特征,确保动态场景中主体身份的高度稳定性和一致性。
- 🌍 新场景生成: 能够创建完全新颖独特的内容,例如未来主义的角色行走或复杂的互动,同时严格保留参考细节。
- 🎛️ 专业/标准模式: 提供灵活的模式以平衡质量和速度,同时提供对高级相机控制、精确运动精度和逼真物理模拟的强大支持。
- 永 一体化参考文献处理: 无缝融合多个主题(角色、道具和整个场景),生成复杂、连贯且高质量的视频输出。
💲 Kling Video O1 API 定价
Kling Video O1 API 的定价极具竞争力:
- 每秒 0.1176 美元 生成的视频
💻 代码示例
以下是如何集成 Kling Video O1 API 的示例:
与领先人工智能模型的比较
在竞争激烈的AI视频生成领域,Kling Video O1脱颖而出:
- 🆚 与 Google Veo 3.1 相比: Kling O1 在参考保真度方面比 Veo 3.1 提升了惊人的 247%,并能提供卓越的多视角融合,且不会损失相干性。Veo 在处理复杂的主体交互时常常表现出局限性。
- 🆚 对比 Runway Gen-4.5: Kling 在各个角度都能提供卓越的标识保持性,使其成为实现专业级一致性的理想选择。Runway Gen-4.5 更侧重于文本驱动的动态效果,但在整合多个参考输入时稳定性较差。
- 🆚 vs. 海罗 2.3: Kling 先进的“思维链”推理技术确保了更流畅的物理效果和镜头运动,从而带来更高的视频质量和更自然的运动效果。海罗 2.3 在视频生成速度方面可能表现出色,但在保持较长视频片段的拍摄对象稳定性方面通常略逊一筹。
❓ 常见问题解答 (FAQ)
Kling Video O1 参考视频是什么?
Kling Video O1 是快手推出的统一多模态 AI 模型,即使在新的场景中,也能直接从图像参考生成具有一致主题、道具和场景的视频。
Kling Video O1 支持哪些主要输入类型?
它主要接受单个或多个参考图像(JPG、JPEG、PNG),每个元素最多可有 4 个视角,还可以选择接受最长 10 秒、最大 200MB、分辨率为 2K 的视频参考。
Kling Video O1 生成的视频时长是多少?分辨率是多少?
生成的视频通常为 5-10 秒,标准分辨率为 1080p,最高可达 2K,帧速率为每秒 30 帧。
Kling Video O1 在身份一致性方面有哪些优势?
其统一的多模态引擎,结合思维链(CoT)推理、多元素融合和视觉语言处理,确保在复杂场景中实现精确稳定的身份保留。
使用 Kling Video O1 API 的费用是多少?
Kling Video O1 API 的定价为每秒生成视频内容 0.1176 美元。



登录