qwen-bg
max-ico04
出去
max-ico02
聊天
max-ico03
禁用
Kling V2.1 Pro 图像转视频
它支持更长的视频时长和多语言、多模式控制,可用于生成专业级的视频内容。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/generate/video/kling/generation', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'kling-video/v2.1/pro/image-to-video',
      prompt: 'Mona Lisa puts on glasses with her hands.',
      image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
      duration: '5',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/generate/video/kling/generation"
    payload = {
        "model": "kling-video/v2.1/pro/image-to-video",
        "prompt": "Mona Lisa puts on glasses with her hands.",
        "image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
        "duration": "5",
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
qwenmax-bg
图片
Kling V2.1 Pro 图像转视频

产品详情

Kling V2.1 Pro Kling V2.1 Pro 代表了 Kling 系列图像转视频生成技术的最新进展。它提供无与伦比的视频合成质量、更强的语义相关性和更强大的创作控制能力。基于 Kling V2.0 Standard 的强大基础,这款专业版集成了先进的图像理解、长时视频生成和自适应风格渲染技术,能够满足最苛刻的多媒体制作工作流程需求。Kling V2.1 Pro 专为视觉艺术家、制作工作室和企业而设计,能够从静态图像生成可扩展的高保真视频。它引入了增强的上下文嵌入和复杂的时序动态功能,以支持复杂的视觉叙事和创新驱动的工作流程。

⚙️技术规格

  • 视频生成质量: 采用新一代时空合成和帧插值算法,确保超流畅的运动连续性和惊人的照片级真实感,显著减少生成序列中的视觉伪影和时间噪声。
  • 分辨率和帧速率: 支持无缝生成高达 4K 超高清分辨率,稳定 30 帧/秒这是通过优化的渲染引擎实现的,这些引擎优先考虑视觉保真度和计算效率。
  • 输入图像处理: 采用精细的图像编码流程,能够从各种图像格式和分辨率中提取深层的语义和构成特征,从而能够从单个或一批图像中进行精确的叙事推断和视觉扩展。
  • 摄影机及电影特效: 集成了先进的虚拟电影摄影技术,包括动态跟踪、摇臂镜头、变焦、视差偏移和可编程景深效果,在保持实时合成速度的同时,实现了沉浸式和专业的视频合成。

🔬技术细节

模型架构

该模型采用增强型混合Transformer-GAN设计,配备多尺度分层注意力机制和时间一致性模块,专为长程时空建模和帧级一致性而设计。其架构融合了新型图像编码器融合模块,将静态视觉线索与动态视频合成路径相结合,从而实现复杂的场景推进和上下文感知动画。

训练数据

该模型基于专有的大规模数据集进行训练,该数据集结合了多种高分辨率图像和同步视频序列,涵盖叙事电影、广告内容、纪录片和高度风格化的动画等多种类型。该数据集强调多语言标注和丰富的元数据,以增强跨领域适应性和精细的风格控制。

绩效指标

在超高视觉保真度、延迟和计算资源使用之间实现了业界领先的平衡,提供强大的批量处理能力,并可对时间长度、场景复杂性和风格参数进行精细控制,以满足各种制作需求。

💰API定价

每视频秒仅需 0.1029 美元

主要特点

  • 高保真图像到视频的生成: 将静态图像转换为连贯、细节丰富的流畅视频序列,在保留关键视觉特征的同时,创造性地扩展源内容。
  • 扩展时间范围: 支持最长视频时长 30秒利用丰富的上下文记忆,在不断变化的场景中保持主题和视觉一致性。
  • 动态电影模拟: 提供先进的摄像机操作工具包,包括平滑的推拉和摇臂运动、多轴旋转、深度调制和焦点切换,从而实现专业的视觉叙事和戏剧性效果的创造。
  • 多风格和多类型适应性: 经过广泛的、类型多样的数据集训练,能够忠实地再现真人电影、动画、纪录片和实验风格,并具有高保真度的风格细微差别和内容变化。
  • 多语言和多模态提示: 它具备强大的多语言理解能力(英语、普通话和其他语言),并支持多模态输入,结合文本注释和视觉提示,从而能够精确控制和本地化,以满足全球生产需求。

💡用例

  • 利用照片素材生成篇幅较长、叙事性强的视频内容,用于广告、营销和教育目的。
  • 电影级故事板和概念开发,将静态艺术转化为动态画面。
  • 通过图像动画增强社交媒体视频效果和创意。
  • 利用照片档案进行纪录片和叙事视频增强。
  • 利用高分辨率图像合成动画和真人视频。
  • 为创意工作室和企业沟通团队提供企业级多媒体内容生成服务。
  • 利用图像输入进行快速视觉原型设计和迭代故事开发。
  • 为多元化的国际市场量身定制的多语种视频制作。

💻代码示例

 

📊与其他型号的比较

与 Kling V2.0 标准 I2V 相比: Kling V2.1 Pro 将视频持续时间从 15 分钟显著延长至 30秒提升最高分辨率和帧速率稳定性 4K/30fps该版本引入了更复杂的图像编码和时间一致性方法,并通过多轴动态效果增强了相机模拟功能。此外,专业版还提高了推理效率,支持企业级批量处理,并提供更精细的场景和风格控制。

对比 Kling V1.5 Pro T2V: Kling V1.5 Pro 专注于文本到视频的生成,而 Kling V2.1 Pro I2V 则开创了复杂的图像到视频合成技术,具有更高的分辨率、更长的视频持续时间、增强的运动真实感和多源多模态集成,体现了重要的架构创新和扩展的应用范围。

常见问题解答 (FAQ)

问:Kling V2.1 Pro有哪些优势使其成为专业多媒体制作的理想选择?

答:Kling V2.1 Pro 提供无与伦比的视频合成质量、30fps 的 4K 超高清分辨率、长达 30 秒的视频时长以及先进的电影级特效。这些特性,结合其强大的图像理解能力和自适应风格渲染技术,使其能够满足电影、广告和企业内容创作等高要求专业工作流程的需求。

问:Kling V2.1 Pro 与 Kling V2.0 标准版有何不同?

答:V2.1 Pro 版本显著延长了视频时长,从 15 秒延长至 30 秒,并将分辨率和帧率提升至 4K/30fps,同时引入了更先进的图像编码流程。此外,它还增强了相机模拟功能,增加了多轴动态效果,并提高了企业级批量处理的推理效率。

问:Kling V2.1 Pro 提供哪些类型的创作控制?

答:用户可通过动态电影模拟(移动镜头、摇臂、变焦、景深)、多风格和类型适应性以及强大的多语言/多模态提示功能,获得广泛的创作控制权。这使得用户能够进行精准的叙事延伸和定制化的视觉故事讲述。

问:Kling V2.1 Pro 的 API 定价结构是怎样的?

答:API 的定价为 每视频秒 0.1029 美元提供具有竞争力的高保真视频生成价格。

问:Kling V2.1 Pro 能否处理不同语言的内容生成?

答:是的,它具备强大的多语言理解能力,支持英语、普通话及其他语言。这一特性结合多模态输入,能够实现精准的控制和本地化,满足全球生产需求。

API 操练场(Playground)

集成前,请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。
免费试用
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用