



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'klingai/video-o1-image-to-video',
prompt: 'A jellyfish in the ocean',
image_url: 'https://upload.wikimedia.org/wikipedia/commons/3/35/Maldivesfish2.jpg',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "klingai/video-o1-image-to-video",
"prompt": "A jellyfish in the ocean",
"image_url": "https://upload.wikimedia.org/wikipedia/commons/3/35/Maldivesfish2.jpg",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

产品详情
💡Kling Video O1:提升动态视频生成能力
这 Kling Video O1 API 是一款先进的解决方案,旨在将静态图像转换为引人入胜的动态视频。它擅长从指定的起始帧和结束帧创建无缝过渡,巧妙地将图像输入与用户自定义的文本提示融合在一起,从而实现对运动、艺术风格和叙事流程的无与伦比的控制。这种强大的统一多模态模型针对复杂的应用场景进行了优化。 电影式叙事 通过先进的帧插值技术。
⚙️技术规格
- • 建筑学: 基于坚固 Kling O1 多模态视频基础模型结合思维链(CoT)推理,实现精确的提示分析,并显著提高输出保真度。
- • 输入格式: 可接受多种图像输入,包括 .png、.jpeg、.tiff 和 .webp 格式同时提供全面的文字提示,指导帧动画制作。
- • 输出格式: 生成高质量 MP4视频 支持时长为 5 秒或 10 秒的视频片段,支持高达 16:9 的灵活宽高比。
🚀性能基准
Kling O1 达到行业领先水平 运动一致性确保角色和物体完美地保持其属性,不会发生变形。这在帧间稳定性方面比之前的模型有了显著提升。集成的推理步骤提高了整体质量,在 5-10 秒的短片中呈现逼真的镜头流动,分辨率最高可达 2K。基准测试始终强调其在处理复杂物理和多主体交互方面的卓越表现,尤其是在以下方面: 优于 Kling 2.1。
✨Kling Video O1 的主要特点
- • 多模态引擎: 处理图像、视频和文本输入,以实现精确控制。 风格转移精确的元素保存和自然物理模拟,包括流体运动和织物动力学。
- • 高级帧插值: 在整个视频序列中,能够无缝地实现关键帧之间的平滑过渡,始终保持主体身份和复杂的环境细节。
- • 高级相机控制: 可对摄像机运动进行精细控制,实现高度精确的平移、倾斜和跟踪拍摄,从而显著减少动态场景中的视觉瑕疵。
- • 基于参考的生成: 支持集成 1 至 7 张参考图像,确保强大的多元素一致性。此功能非常适合在不同角度和复杂场景下保持角色或物体的稳定性。
💲Kling O1 API 定价
Kling O1 API 的价格极具竞争力。 每秒 0.1176 美元 生成的视频输出。
💻代码示例
使用以下简单代码片段集成 Kling Video O1 的图像转视频功能:
data-name = "video.image-to-video" data-model = "klingai/video-o1-image-to-video" > ⚖️模型对比
Kling O1 对阵 Kling 2.1: Kling O1 引入了先进的 CoT推理 并支持 多模态输入达到约 运动精度提高2倍 并且具有更出色的主题一致性。相比之下,Kling 2.1 则专注于经济高效的标准图像转视频转换,不具备这些高级编辑功能。
Kling O1 对阵 Runway Gen-4: O1 以其卓越的性能脱颖而出。 帧特定插值 并且在处理 5-10 秒的视频片段时,物理效果更加逼真。虽然第四代产品更侧重于处理较长的文本转视频内容,但与 Kling O1 相比,其多图像参考稳定性方面存在不足。
Kling O1 对比 Google Veo 3.1: Kling O1 提供 优异的元素保存 在双帧动画之间切换时,它能够进行复杂的对话式编辑,从而提高精度。虽然 Veo 3.1 可能具备生成更长原始视频的功能,但 Kling O1 是需要高精度的商业应用的首选,并且提供了更多功能。 成本效益高的每秒速率。
❓常见问题解答
问题1: Kling Video O1的核心功能是什么?
A:Kling Video O1 将静态的开始和结束图像帧转换为动态视频,利用文本提示来控制运动和风格,专门通过帧插值进行电影式叙事。
Q2: Kling O1 如何确保高运动一致性?
答:它采用统一的多模态架构和思维链 (CoT) 推理,对提示进行深度分析,以确保角色和对象在整个视频中保持其属性而不变形,在稳定性方面优于之前的模型。
Q3: 与 Kling 2.1 相比,Kling O1 的主要优势是什么?
答:Kling O1 具有 CoT 推理和多模态输入,运动精度和主体一致性比 Kling 2.1 更基本的图像到视频功能高出约 2 倍。
第四季度: Kling O1 能否处理复杂的摄像机运动?
答:是的,它提供先进的相机控制功能,可进行精确的平移、倾斜和跟踪拍摄,旨在最大限度地减少伪影,并确保动态场景中的高运动精度。
Q5: Kling Video O1 的输出规格是什么?
答:它可输出 5 秒或 10 秒时长的 MP4 视频,支持高达 16:9 的宽高比,分辨率最高可达 2K。



登录