



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'google/veo-3.1-t2v',
prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "google/veo-3.1-t2v",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background"
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()
- API 操练场(Playground)

在集成之前,请在沙箱环境中测试所有 API 模型。
我们提供超过 300 种模型供您集成到您的应用程序中。


产品详情
发现 我看到3.1这是GoogleDeepMind公司开发的尖端AI视频生成模型,旨在将文本提示转化为高保真、电影级的视频。这款先进模型擅长创建栩栩如生的角色、保持主题一致性以及提供同步音频,使其成为跨多种视频格式无缝叙事的理想之选。
💡 Veo 3.1 的主要功能
- ⭐
电影写实主义: 生成具有自然光照、流畅的镜头运动和准确视角的视频,重现专业电影品质。
- 🔊
原生音频生成: 体验完美同步的环境音效、对话和音乐,增强沉浸感。
- 🎭
主体一致性(R2V): 在所有帧中使用 1-3 张参考图像,以保持一致的角色和物体标识。
- 🎬
无缝叙事: 利用视频插值实现平滑过渡,并支持多种格式(16:9、9:16),适用于各种平台。
🚀 技术规格
- 解决: 最高支持 1080p 全高清
- 帧率: 每秒 24 帧
- 视频时长选项: 4秒、6秒和8秒
- 宽高比: 16:9(水平)和 9:16(垂直)
📊 性能基准测试
- 专业品质: 制作的视频具有精准的物理效果和极高的真实感。
- 立即遵守: 擅长按照提示操作,并在帧与帧之间保持角色/对象的完整性。
- 增强沉浸感: 生成同步音频元素,带来真正身临其境的体验。
- 高效发电: 提供高效的发电时间,并可选择平衡质量和速度。
💰 Veo 3.1 API 定价
每秒 0.21 美元 (音频关闭)
每秒 0.42 美元 (音频已开启)
🎯 使用案例
- 电影化叙事: 非常适合需要逼真角色和自然音效的营销视频。
- 社交媒体内容: 非常适合使用竖屏模式的 TikTok 和 Instagram 等平台。
- 产品演示: 创建具有一致视觉品牌形象的教程。
- 动画短片: 生成需要流畅过渡和口型同步对话的场景。
💻 代码示例
🆚 与其他型号的比较
Veo 对阵 Runway ML: 我看到一些优惠 原生同步音频和高级唇音同步 Runway 则侧重于灵活的视频编辑,而不太注重音频视频集成。
Veo 对阵 Pika Labs: Veo 专长于 电影的真实感和主题的一致性 使用参考图像。Pika Labs 优先考虑快速动画生成和用户友好的界面,以实现快速原型制作。
Veo 对战 Luma AI: Veo支持 更长的时长,并具有精细的视听保真度Luma 更注重 3D 场景生成和空间渲染,而非纯粹的文本转视频功能。
🔌 API 集成
可通过 AI/ML API 访问。有关详细文档,请参阅…… 官方文件。
❓ 常见问题解答 (FAQ)
问:Veo 3.1 文本转视频 AI 模型是什么?
答:Veo 3.1 Text to Video 是 Google DeepMind 的一款高级 AI 模型,它可以根据文本描述生成高质量、详细的视频,创建具有高级动态效果和电影级质量的复杂视觉叙事和专业级内容。
问:Veo 3.1 文本转视频的主要优势是什么?
答:主要优势包括卓越的视频质量、复杂的场景理解、细致的视觉叙事、复杂的运动动力学、专业级的输出、先进的电影特效以及处理复杂的多元素合成的能力。
问:Veo 3.1 文字转视频功能的价格是多少?
答:Veo 3.1 文字转视频的定价为每秒 0.21 美元(音频关闭)和每秒 0.42 美元(音频开启),这反映了其优质的质量和先进的功能。
问:它支持哪些视频格式和分辨率?
答:该型号可输出分辨率高达 1920x1080 (1080p) 的专业级视频,并支持包括 16:9 和 9:16 在内的电影宽高比。
问:Veo 3.1 能否处理复杂的角色动画和交互?
答:是的,Veo 3.1 擅长生成逼真的角色动作、面部表情、多角色互动以及具有自然运动动力学和情感表达的复杂人类动画。



登录