qwen-bg
max-ico04
Em
Fora
max-ico02
Bater papo
max-ico03
desativar
TripoSR 3D estável
A API TripoSR gera malhas 3D de alta qualidade a partir de imagens individuais em menos de 0,5 segundos, utilizando arquitetura Transformer para reconstrução eficiente.
Tokens de $1 grátis para novos membros
Text to Speech
                                        const fs = require('fs');
const { Readable } = require('stream');
const { finished } = require('stream/promises');

const main = async () => {
  const {
    model_mesh: { url, file_name },
  } = await fetch('https://api.ai.cc/v1/image/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'triposr',
      image_url: 'https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png',
    }),
  }).then((res) => res.json());

  const { body } = await fetch(url);
  const stream = fs.createWriteStream(`./${file_name}`);
  await finished(Readable.fromWeb(body).pipe(stream));
};

main();
                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "triposr",
            "image_url": "https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png",
        },
    )

    response.raise_for_status()
    data = response.json()
    url = data["model_mesh"]["url"]
    file_name = data["model_mesh"]["file_name"]

    mesh_response = requests.get(url, stream=True)

    with open(file_name, "wb") as file:
        for chunk in mesh_response.iter_content(chunk_size=8192):
            file.write(chunk)


if __name__ == "__main__":
    main()
Docs

Uma API com mais de 300 modelos de IA

Economize 20% nos custos e ganhe tokens grátis de $1.
qwenmax-bg
imagem
TripoSR 3D estável

Detalhes do produto

Apresentando o TripoSR: Revolucionando a reconstrução de imagens em 3D.

TripoSR é um modelo inovador baseado em transformadores, desenvolvido em conjunto por IA de estabilidade e Tripo AILançada em 4 de março de 2024, esta versão 1.0 do modelo estabelece um novo padrão para a reconstrução rápida de objetos 3D. Ela se destaca na geração de malhas 3D de alta qualidade a partir de uma única imagem RGB, alcançando esse feito em menos de [tempo não especificado]. 0,5 segundos em uma GPU NVIDIA A100.

💡 Principais funcionalidades e recursos

  • 🚀 Geração ultrarrápida: Realiza geração 3D feed-forward em menos de 0,5 segundos.
  • 🧠 Arquitetura Avançada de Transformadores: Utiliza um design de transformador eficiente para processamento sofisticado.
  • Malhas 3D de alta qualidade: Produz malhas 3D detalhadas e precisas.
  • 🖼️ Entrada de imagem única: Simplifica o processo, exigindo apenas uma imagem RGB.
  • 🏆 Desempenho de última geração: Lidera em distância de chanfro e métricas de pontuação F em relação aos concorrentes.

🎯 Aplicações pretendidas

O TripoSR foi projetado para setores que exigem visualização 3D rápida diretamente de imagens 2D. Suas principais aplicações incluem:

  • Entretenimento: Para criação rápida de elementos gráficos em filmes e animações.
  • Jogos: Prototipagem rápida e geração de recursos para jogos.
  • Design Industrial: Visualização acelerada de conceitos de produtos.
  • Arquitetura: Conversão rápida de esboços ou fotos arquitetônicas em modelos 3D.

Por ser um modelo 3D baseado em imagens, o TripoSR opera independentemente de idiomas humanos, tornando-o universalmente aplicável.

⚙️ Análise técnica detalhada

Arquitetura do Modelo

A arquitetura sofisticada do TripoSR é uma combinação de componentes baseados em transformadores, meticulosamente otimizados para uma reconstrução 3D superior:

  1. Codificador de imagem:
    • Utiliza um transformador de visão pré-treinado DINOv1.
    • Transforma imagens RGB em vetores latentes, capturando características globais e locais.
  2. Decodificador de imagem para triplano:
    • Um decodificador baseado em transformador.
    • Converte vetores latentes em uma representação triplanar NeRF (Campo de Radiância Neural).
    • Utiliza mecanismos avançados de atenção para aprender relações complexas entre os componentes triplanos.
  3. Campo de Radiância Neural baseado em Triplano (NeRF):
    • A etapa final gera a representação 3D.
    • Otimizado especificamente para lidar com formas e texturas complexas de forma eficaz.

Dados de treinamento

O modelo foi rigorosamente treinado em um subconjunto cuidadosamente selecionado do extenso conjunto de dados. Conjunto de dados publicado, escolhida especificamente por seu foco em modelos 3D realistas e de alta qualidade.

Métricas de desempenho

O TripoSR supera consistentemente outras alternativas de código aberto tanto em avaliações quantitativas quanto qualitativas. Ele demonstra desempenho excepcional em métricas críticas como: Distância do chanfro e Pontuação F em uma ampla variedade de conjuntos de dados diversos.

📊 Comparação com outros modelos

  • ✔️ Precisão: Oferece qualidade superior de reconstrução 3D em comparação com outras soluções de código aberto.
  • Velocidade: Gera malhas 3D complexas em menos de 0,5 segundos em uma GPU NVIDIA A100.
  • 🛡️ Robustez: Apresenta notável adaptabilidade a diversas condições de imagem, inferindo parâmetros da câmera dinamicamente, sem depender de condicionamento explícito.

🛠️ Uso e licenciamento

Exemplos de código

Para desenvolvedores que desejam integrar o TripoSR, exemplos de código e documentação estão disponíveis. Você pode Explore o anúncio oficial e os recursos do TripoSR. Para obter guias de implementação detalhados.

Diretrizes Éticas e Licenciamento

TripoSR é lançado sob a licença permissiva. Licença MITIsso promove o desenvolvimento de código aberto e incentiva a implementação responsável em diversas áreas, incluindo IA, visão computacional e aplicações de computação gráfica. A Licença MIT permite amplo uso, abrangendo aplicações comerciais, pessoais e de pesquisa.

Ao aproveitar os recursos avançados do TripoSR, os desenvolvedores podem criar aplicativos de reconstrução 3D poderosos com velocidade e precisão sem precedentes. Essa inovação abre novas e empolgantes possibilidades em diversos domínios que dependem da conversão rápida de 2D para 3D.

Perguntas frequentes (FAQ)

P: O que é TripoSR?
A: O TripoSR é um modelo avançado de reconstrução de imagem para 3D desenvolvido pela Stability AI e Tripo AI. Ele gera malhas 3D de alta qualidade a partir de uma única imagem RGB 2D de forma muito rápida.
P: Qual a velocidade de geração de um modelo 3D pelo TripoSR?
A: Ele consegue gerar uma malha 3D em menos de 0,5 segundos quando executado em uma GPU NVIDIA A100, tornando-o uma das soluções mais rápidas disponíveis.
P: Que tipo de entrada o TripoSR requer?
A: O TripoSR requer apenas uma única imagem RGB para realizar a reconstrução de objetos em 3D.
P: Quais são as principais aplicações do TripoSR?
A: É ideal para aplicações em entretenimento, jogos, design industrial e arquitetura, onde a visualização 3D rápida a partir de imagens 2D é crucial.
P: Qual é o licenciamento para o TripoSR?
A: O TripoSR é distribuído sob a licença permissiva MIT, que permite seu uso para fins comerciais, pessoais e de pesquisa, promovendo o desenvolvimento de IA aberto e responsável.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.
Experimente grátis
api-right-1
modelo-bg02-1

Uma API
Mais de 300 modelos de IA

Economize 20% nos custos