



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'klingai/video-o1-reference-to-video',
prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
image_list: [
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
],
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "klingai/video-o1-reference-to-video",
"prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
"image_list": [
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
]
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalhes do produto
🚀 API Kling Video O1: Geração inovadora de vídeo a partir de referências
Kuaishou's Vídeo Kling O1 Referência ao Vídeo Oferece geração de vídeo consistente e sem precedentes a partir de imagens de referência. Este modelo multimodal unificado utiliza extração de recursos avançada para preservar impecavelmente a identidade de personagens, objetos e cenas em cenários totalmente novos e diversos, estabelecendo um novo padrão na criação de vídeos com inteligência artificial.
⚙️ Especificações Técnicas
- Suporte de entrada: Aceita uma ou várias imagens de referência (até 4 pontos de vista por elemento) nos formatos JPG, JPEG ou PNG. Também são suportadas referências de vídeo opcionais com duração de até 10 segundos, 200 MB e resolução 2K.
- Capacidades de saída: Gera vídeos com duração de 5 a 10 segundos, com resoluções de até 2K (padrão 1080p), a 30 quadros por segundo (fps). As proporções de tela mais comuns, incluindo 16:9, são totalmente suportadas.
- Arquitetura do modelo: Construído sobre um poderoso mecanismo multimodal unificado que incorpora Raciocínio em Cadeia de Pensamento (CoT), fusão de múltiplos elementos e processamento sofisticado de visão e linguagem para retenção precisa da identidade e compreensão contextual profunda.
📈 Indicadores de desempenho
O Kling Video O1 se destaca tanto na consistência da identidade visual quanto na qualidade do movimento, superando os concorrentes em tarefas críticas de geração de referências:
- ✅ Demonstra um Melhoria de 247% em tarefas de geração de referência em comparação com Google Veo 3.1.
- ✅ Conseguiu um Melhoria de 230% sobre Pista Aleph em benchmarks semelhantes.
- ✨ Apresenta estabilidade de enquadramento superior, reduzindo efetivamente a cintilação em cenas complexas com múltiplos elementos.
- 🧠 O raciocínio aprimorado via CoT aumenta significativamente a precisão das respostas, analisando de forma inteligente as entradas antes da renderização.
🌟 Principais recursos do Kling Video O1
- 🖼️ Edifício de disciplinas com múltiplas referências: Extrai características abrangentes de diversos pontos de vista, garantindo uma identidade altamente estável e consistente para os sujeitos em cenas dinâmicas.
- 🌍 Nova geração de cenários: Permite a criação de conteúdo totalmente novo e original, como movimentos futuristas de personagens ou interações complexas, mantendo rigorosamente os detalhes de referência.
- 🎛️ Modos Profissional/Padrão: Oferece modos flexíveis para equilibrar qualidade e velocidade, além de suporte robusto para controle avançado de câmera, precisão de movimento e simulação física realista.
- Yong Manuseio de referência tudo-em-um: Combina perfeitamente múltiplos elementos (personagens, objetos e cenas inteiras) para produzir vídeos complexos, consistentemente coerentes e de alta qualidade.
💲 Preços da API Kling Video O1
A API Kling Video O1 é oferecida a um preço competitivo:
- US$ 0,1176 por segundo de vídeo gerado
💻 Exemplo de código
Aqui está um exemplo de como integrar a API Kling Video O1:
Comparação com os principais modelos de IA
O Kling Video O1 se destaca no cenário competitivo da geração de vídeos com IA:
- 🆚 vs. Google Veo 3.1: O Kling O1 supera o Veo 3.1 em impressionantes 247% em fidelidade de referência, oferecendo fusão multiview superior sem perda de coerência. O Veo frequentemente apresenta limitações no processamento de interações complexas entre sujeitos.
- 🆚 vs. Pista Gen-4.5: O Kling oferece uma retenção de identidade excepcional em vários ângulos, tornando-o ideal para consistência de nível profissional. O Runway Gen-4.5 concentra-se mais em movimentos orientados por texto, mas apresenta dificuldades de estabilidade ao incorporar várias entradas de referência.
- 🆚 vs. Hailuo 2.3: O raciocínio avançado da Cadeia de Pensamento do Kling garante uma física e um trabalho de câmera mais suaves, resultando em maior qualidade e movimentos mais naturais. O Hailuo 2.3 pode se destacar na velocidade de geração, mas geralmente fica para trás na manutenção da estabilidade do objeto em videoclipes mais longos.
❓ Perguntas frequentes (FAQ)
O que é o vídeo de referência Kling O1?
O Kling Video O1 é um modelo de IA multimodal unificado da Kuaishou que gera vídeos com assuntos, objetos e cenas consistentes diretamente a partir de referências de imagem, mesmo em novos cenários.
Quais são os principais tipos de entrada suportados pelo Kling Video O1?
Ele aceita principalmente imagens de referência únicas ou múltiplas (JPG, JPEG, PNG) com até 4 pontos de vista por elemento e, opcionalmente, referências de vídeo de até 10 segundos, 200 MB e resolução 2K.
Qual a duração e a resolução dos vídeos gerados pelo Kling Video O1?
Os vídeos gerados têm normalmente entre 5 e 10 segundos de duração, com resolução padrão de 1080p e um máximo de 2K, a 30 quadros por segundo.
O que torna o Kling Video O1 superior em termos de consistência de identidade?
Seu mecanismo multimodal unificado, aliado ao raciocínio Chain of Thought (CoT), à fusão de múltiplos elementos e ao processamento de visão e linguagem, garante a retenção precisa e estável da identidade em cenas complexas.
Qual é o custo de utilização da API Kling Video O1?
A API Kling Video O1 tem o preço de US$ 0,1176 por segundo de conteúdo de vídeo gerado.
Playground de IA



Conecte-se