



const fs = require('fs');
const { Readable } = require('stream');
const { finished } = require('stream/promises');
const main = async () => {
const {
model_mesh: { url, file_name },
} = await fetch('https://api.ai.cc/v1/image/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'triposr',
image_url: 'https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png',
}),
}).then((res) => res.json());
const { body } = await fetch(url);
const stream = fs.createWriteStream(`./${file_name}`);
await finished(Readable.fromWeb(body).pipe(stream));
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "triposr",
"image_url": "https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png",
},
)
response.raise_for_status()
data = response.json()
url = data["model_mesh"]["url"]
file_name = data["model_mesh"]["file_name"]
mesh_response = requests.get(url, stream=True)
with open(file_name, "wb") as file:
for chunk in mesh_response.iter_content(chunk_size=8192):
file.write(chunk)
if __name__ == "__main__":
main()

Detalhes do produto
Apresentando o TripoSR: Revolucionando a reconstrução de imagens em 3D.
TripoSR é um modelo inovador baseado em transformadores, desenvolvido em conjunto por IA de estabilidade e Tripo AILançada em 4 de março de 2024, esta versão 1.0 do modelo estabelece um novo padrão para a reconstrução rápida de objetos 3D. Ela se destaca na geração de malhas 3D de alta qualidade a partir de uma única imagem RGB, alcançando esse feito em menos de [tempo não especificado]. 0,5 segundos em uma GPU NVIDIA A100.
💡 Principais funcionalidades e recursos
- 🚀 Geração ultrarrápida: Realiza geração 3D feed-forward em menos de 0,5 segundos.
- 🧠 Arquitetura Avançada de Transformadores: Utiliza um design de transformador eficiente para processamento sofisticado.
- ✨ Malhas 3D de alta qualidade: Produz malhas 3D detalhadas e precisas.
- 🖼️ Entrada de imagem única: Simplifica o processo, exigindo apenas uma imagem RGB.
- 🏆 Desempenho de última geração: Lidera em distância de chanfro e métricas de pontuação F em relação aos concorrentes.
🎯 Aplicações pretendidas
O TripoSR foi projetado para setores que exigem visualização 3D rápida diretamente de imagens 2D. Suas principais aplicações incluem:
- Entretenimento: Para criação rápida de elementos gráficos em filmes e animações.
- Jogos: Prototipagem rápida e geração de recursos para jogos.
- Design Industrial: Visualização acelerada de conceitos de produtos.
- Arquitetura: Conversão rápida de esboços ou fotos arquitetônicas em modelos 3D.
Por ser um modelo 3D baseado em imagens, o TripoSR opera independentemente de idiomas humanos, tornando-o universalmente aplicável.
⚙️ Análise técnica detalhada
Arquitetura do Modelo
A arquitetura sofisticada do TripoSR é uma combinação de componentes baseados em transformadores, meticulosamente otimizados para uma reconstrução 3D superior:
- Codificador de imagem:
- Utiliza um transformador de visão pré-treinado DINOv1.
- Transforma imagens RGB em vetores latentes, capturando características globais e locais.
- Decodificador de imagem para triplano:
- Um decodificador baseado em transformador.
- Converte vetores latentes em uma representação triplanar NeRF (Campo de Radiância Neural).
- Utiliza mecanismos avançados de atenção para aprender relações complexas entre os componentes triplanos.
- Campo de Radiância Neural baseado em Triplano (NeRF):
- A etapa final gera a representação 3D.
- Otimizado especificamente para lidar com formas e texturas complexas de forma eficaz.
Dados de treinamento
O modelo foi rigorosamente treinado em um subconjunto cuidadosamente selecionado do extenso conjunto de dados. Conjunto de dados publicado, escolhida especificamente por seu foco em modelos 3D realistas e de alta qualidade.
Métricas de desempenho
O TripoSR supera consistentemente outras alternativas de código aberto tanto em avaliações quantitativas quanto qualitativas. Ele demonstra desempenho excepcional em métricas críticas como: Distância do chanfro e Pontuação F em uma ampla variedade de conjuntos de dados diversos.
📊 Comparação com outros modelos
- ✔️ Precisão: Oferece qualidade superior de reconstrução 3D em comparação com outras soluções de código aberto.
- ⚡ Velocidade: Gera malhas 3D complexas em menos de 0,5 segundos em uma GPU NVIDIA A100.
- 🛡️ Robustez: Apresenta notável adaptabilidade a diversas condições de imagem, inferindo parâmetros da câmera dinamicamente, sem depender de condicionamento explícito.
🛠️ Uso e licenciamento
Exemplos de código
Para desenvolvedores que desejam integrar o TripoSR, exemplos de código e documentação estão disponíveis. Você pode Explore o anúncio oficial e os recursos do TripoSR. Para obter guias de implementação detalhados.
Diretrizes Éticas e Licenciamento
TripoSR é lançado sob a licença permissiva. Licença MITIsso promove o desenvolvimento de código aberto e incentiva a implementação responsável em diversas áreas, incluindo IA, visão computacional e aplicações de computação gráfica. A Licença MIT permite amplo uso, abrangendo aplicações comerciais, pessoais e de pesquisa.
Ao aproveitar os recursos avançados do TripoSR, os desenvolvedores podem criar aplicativos de reconstrução 3D poderosos com velocidade e precisão sem precedentes. Essa inovação abre novas e empolgantes possibilidades em diversos domínios que dependem da conversão rápida de 2D para 3D.
❓ Perguntas frequentes (FAQ)
- P: O que é TripoSR?
- A: O TripoSR é um modelo avançado de reconstrução de imagem para 3D desenvolvido pela Stability AI e Tripo AI. Ele gera malhas 3D de alta qualidade a partir de uma única imagem RGB 2D de forma muito rápida.
- P: Qual a velocidade de geração de um modelo 3D pelo TripoSR?
- A: Ele consegue gerar uma malha 3D em menos de 0,5 segundos quando executado em uma GPU NVIDIA A100, tornando-o uma das soluções mais rápidas disponíveis.
- P: Que tipo de entrada o TripoSR requer?
- A: O TripoSR requer apenas uma única imagem RGB para realizar a reconstrução de objetos em 3D.
- P: Quais são as principais aplicações do TripoSR?
- A: É ideal para aplicações em entretenimento, jogos, design industrial e arquitetura, onde a visualização 3D rápida a partir de imagens 2D é crucial.
- P: Qual é o licenciamento para o TripoSR?
- A: O TripoSR é distribuído sob a licença permissiva MIT, que permite seu uso para fins comerciais, pessoais e de pesquisa, promovendo o desenvolvimento de IA aberto e responsável.
Playground de IA



Conecte-se