



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/generate/video/kling/generation', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'kling-video/v2.1/pro/image-to-video',
prompt: 'Mona Lisa puts on glasses with her hands.',
image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
duration: '5',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/generate/video/kling/generation"
payload = {
"model": "kling-video/v2.1/pro/image-to-video",
"prompt": "Mona Lisa puts on glasses with her hands.",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
"duration": "5",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

产品详情
Kling V2.1 Pro Kling V2.1 Pro 代表了 Kling 系列图像转视频生成技术的最新进展。它提供无与伦比的视频合成质量、更强的语义相关性和更强大的创作控制能力。基于 Kling V2.0 Standard 的强大基础,这款专业版集成了先进的图像理解、长时视频生成和自适应风格渲染技术,能够满足最苛刻的多媒体制作工作流程需求。Kling V2.1 Pro 专为视觉艺术家、制作工作室和企业而设计,能够从静态图像生成可扩展的高保真视频。它引入了增强的上下文嵌入和复杂的时序动态功能,以支持复杂的视觉叙事和创新驱动的工作流程。
⚙️技术规格
- 视频生成质量: 采用新一代时空合成和帧插值算法,确保超流畅的运动连续性和惊人的照片级真实感,显著减少生成序列中的视觉伪影和时间噪声。
- 分辨率和帧速率: 支持无缝生成高达 4K 超高清分辨率,稳定 30 帧/秒这是通过优化的渲染引擎实现的,这些引擎优先考虑视觉保真度和计算效率。
- 输入图像处理: 采用精细的图像编码流程,能够从各种图像格式和分辨率中提取深层的语义和构成特征,从而能够从单个或一批图像中进行精确的叙事推断和视觉扩展。
- 摄影机及电影特效: 集成了先进的虚拟电影摄影技术,包括动态跟踪、摇臂镜头、变焦、视差偏移和可编程景深效果,在保持实时合成速度的同时,实现了沉浸式和专业的视频合成。
🔬技术细节
模型架构
该模型采用增强型混合Transformer-GAN设计,配备多尺度分层注意力机制和时间一致性模块,专为长程时空建模和帧级一致性而设计。其架构融合了新型图像编码器融合模块,将静态视觉线索与动态视频合成路径相结合,从而实现复杂的场景推进和上下文感知动画。
训练数据
该模型基于专有的大规模数据集进行训练,该数据集结合了多种高分辨率图像和同步视频序列,涵盖叙事电影、广告内容、纪录片和高度风格化的动画等多种类型。该数据集强调多语言标注和丰富的元数据,以增强跨领域适应性和精细的风格控制。
绩效指标
在超高视觉保真度、延迟和计算资源使用之间实现了业界领先的平衡,提供强大的批量处理能力,并可对时间长度、场景复杂性和风格参数进行精细控制,以满足各种制作需求。
💰API定价
每视频秒仅需 0.1029 美元
✨主要特点
- 高保真图像到视频的生成: 将静态图像转换为连贯、细节丰富的流畅视频序列,在保留关键视觉特征的同时,创造性地扩展源内容。
- 扩展时间范围: 支持最长视频时长 30秒利用丰富的上下文记忆,在不断变化的场景中保持主题和视觉一致性。
- 动态电影模拟: 提供先进的摄像机操作工具包,包括平滑的推拉和摇臂运动、多轴旋转、深度调制和焦点切换,从而实现专业的视觉叙事和戏剧性效果的创造。
- 多风格和多类型适应性: 经过广泛的、类型多样的数据集训练,能够忠实地再现真人电影、动画、纪录片和实验风格,并具有高保真度的风格细微差别和内容变化。
- 多语言和多模态提示: 它具备强大的多语言理解能力(英语、普通话和其他语言),并支持多模态输入,结合文本注释和视觉提示,从而能够精确控制和本地化,以满足全球生产需求。
💡用例
- ✅利用照片素材生成篇幅较长、叙事性强的视频内容,用于广告、营销和教育目的。
- ✅电影级故事板和概念开发,将静态艺术转化为动态画面。
- ✅通过图像动画增强社交媒体视频效果和创意。
- ✅利用照片档案进行纪录片和叙事视频增强。
- ✅利用高分辨率图像合成动画和真人视频。
- ✅为创意工作室和企业沟通团队提供企业级多媒体内容生成服务。
- ✅利用图像输入进行快速视觉原型设计和迭代故事开发。
- ✅为多元化的国际市场量身定制的多语种视频制作。
💻代码示例
📊与其他型号的比较
与 Kling V2.0 标准 I2V 相比: Kling V2.1 Pro 将视频持续时间从 15 分钟显著延长至 30秒提升最高分辨率和帧速率稳定性 4K/30fps该版本引入了更复杂的图像编码和时间一致性方法,并通过多轴动态效果增强了相机模拟功能。此外,专业版还提高了推理效率,支持企业级批量处理,并提供更精细的场景和风格控制。
对比 Kling V1.5 Pro T2V: Kling V1.5 Pro 专注于文本到视频的生成,而 Kling V2.1 Pro I2V 则开创了复杂的图像到视频合成技术,具有更高的分辨率、更长的视频持续时间、增强的运动真实感和多源多模态集成,体现了重要的架构创新和扩展的应用范围。
❓常见问题解答 (FAQ)
问:Kling V2.1 Pro有哪些优势使其成为专业多媒体制作的理想选择?
答:Kling V2.1 Pro 提供无与伦比的视频合成质量、30fps 的 4K 超高清分辨率、长达 30 秒的视频时长以及先进的电影级特效。这些特性,结合其强大的图像理解能力和自适应风格渲染技术,使其能够满足电影、广告和企业内容创作等高要求专业工作流程的需求。
问:Kling V2.1 Pro 与 Kling V2.0 标准版有何不同?
答:V2.1 Pro 版本显著延长了视频时长,从 15 秒延长至 30 秒,并将分辨率和帧率提升至 4K/30fps,同时引入了更先进的图像编码流程。此外,它还增强了相机模拟功能,增加了多轴动态效果,并提高了企业级批量处理的推理效率。
问:Kling V2.1 Pro 提供哪些类型的创作控制?
答:用户可通过动态电影模拟(移动镜头、摇臂、变焦、景深)、多风格和类型适应性以及强大的多语言/多模态提示功能,获得广泛的创作控制权。这使得用户能够进行精准的叙事延伸和定制化的视觉故事讲述。
问:Kling V2.1 Pro 的 API 定价结构是怎样的?
答:API 的定价为 每视频秒 0.1029 美元提供具有竞争力的高保真视频生成价格。
问:Kling V2.1 Pro 能否处理不同语言的内容生成?
答:是的,它具备强大的多语言理解能力,支持英语、普通话及其他语言。这一特性结合多模态输入,能够实现精准的控制和本地化,满足全球生产需求。



登录