



const fs = require('fs');
const { Readable } = require('stream');
const { finished } = require('stream/promises');
const main = async () => {
const {
model_mesh: { url, file_name },
} = await fetch('https://api.ai.cc/v1/image/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'triposr',
image_url: 'https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png',
}),
}).then((res) => res.json());
const { body } = await fetch(url);
const stream = fs.createWriteStream(`./${file_name}`);
await finished(Readable.fromWeb(body).pipe(stream));
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "triposr",
"image_url": "https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png",
},
)
response.raise_for_status()
data = response.json()
url = data["model_mesh"]["url"]
file_name = data["model_mesh"]["file_name"]
mesh_response = requests.get(url, stream=True)
with open(file_name, "wb") as file:
for chunk in mesh_response.iter_content(chunk_size=8192):
file.write(chunk)
if __name__ == "__main__":
main()

Detalles del producto
Presentamos TripoSR: Revolucionando la reconstrucción de imágenes a 3D.
TripoSR es un modelo innovador basado en transformadores desarrollado conjuntamente por IA de estabilidad y Tripo AILanzado el 4 de marzo de 2024, este modelo Versión 1.0 establece un nuevo estándar para la reconstrucción rápida de objetos 3D. Destaca por generar mallas 3D de alta calidad a partir de una sola imagen RGB, logrando esta hazaña en menos de 0,5 segundos en una GPU NVIDIA A100.
💡 Capacidades y características clave
- 🚀 Generación ultrarrápida: Logra la generación 3D de alimentación directa en menos de 0,5 segundos.
- 🧠 Arquitectura avanzada de transformadores: Utiliza un diseño de transformador eficiente para un procesamiento sofisticado.
- ✨ Mallas 3D de alta calidad: Genera mallas 3D detalladas y precisas.
- 🖼️ Entrada de imagen única: Simplifica el proceso al requerir únicamente una imagen RGB.
- 🏆 Rendimiento de vanguardia: Lidera en distancia de chaflán y métricas de puntuación F frente a sus competidores.
🎯 Aplicaciones previstas
TripoSR está diseñado para sectores que requieren una visualización 3D rápida directamente a partir de imágenes 2D. Sus principales aplicaciones incluyen:
- Entretenimiento: Para la creación rápida de recursos en cine y animación.
- Juego de azar: Prototipado rápido y generación de recursos para juegos.
- Diseño industrial: Visualización acelerada de conceptos de producto.
- Arquitectura: Conversión rápida de bocetos arquitectónicos o fotografías en modelos 3D.
Al ser un sistema de conversión de imágenes a modelos 3D, TripoSR funciona independientemente de los lenguajes humanos, lo que lo hace universalmente aplicable.
⚙️ Análisis técnico en profundidad
Arquitectura del modelo
La sofisticada arquitectura de TripoSR es una combinación de componentes basados en transformadores, meticulosamente optimizados para una reconstrucción 3D superior:
- Codificador de imágenes:
- Utiliza un transformador de visión preentrenado DINOv1.
- Transforma las imágenes RGB en vectores latentes, capturando características tanto globales como locales.
- Decodificador de imagen a triplano:
- Un decodificador basado en transformador.
- Convierte vectores latentes en una representación NeRF (Neural Radiance Field) triplanar.
- Emplea mecanismos de atención avanzados para aprender relaciones complejas entre los componentes del triple plano.
- Campo de Radiación Neuronal (NeRF) basado en tres planos:
- La etapa final genera la representación 3D.
- Especialmente optimizado para manejar formas y texturas complejas de manera eficaz.
Datos de entrenamiento
El modelo fue entrenado rigurosamente en un subconjunto cuidadosamente seleccionado del extenso Conjunto de datos publicado, elegido específicamente por su enfoque en modelos 3D realistas y de alta calidad.
Métricas de rendimiento
TripoSR supera sistemáticamente a otras alternativas de código abierto tanto en evaluaciones cuantitativas como cualitativas. Demuestra un rendimiento excepcional en métricas críticas como: Distancia de chaflán y Puntuación F en una amplia gama de conjuntos de datos diversos.
📊 Comparación con otros modelos
- ✔️ Exactitud: Ofrece una calidad de reconstrucción 3D superior en comparación con otras soluciones de código abierto.
- ⚡ Velocidad: Genera mallas 3D complejas en menos de 0,5 segundos en una GPU NVIDIA A100.
- 🛡️ Robustez: Presenta una notable adaptabilidad a diversas condiciones de imagen al inferir los parámetros de la cámara de forma dinámica, sin depender de un condicionamiento explícito.
🛠️ Uso y licencias
Ejemplos de código
Para los desarrolladores que buscan integrar TripoSR, hay ejemplos de código y documentación disponibles. Explora el anuncio oficial y los recursos de TripoSR. para obtener guías de implementación detalladas.
Directrices éticas y licencias
TripoSR se publica bajo el permisivo Licencia MITEsto promueve el desarrollo de código abierto y fomenta una implementación responsable en diversos campos, incluyendo inteligencia artificial, visión artificial y aplicaciones de gráficos por computadora. La licencia MIT permite un uso amplio, abarcando aplicaciones comerciales, personales y de investigación.
Gracias a las capacidades avanzadas de TripoSR, los desarrolladores pueden crear potentes aplicaciones de reconstrucción 3D con una velocidad y precisión sin precedentes. Este avance abre nuevas y fascinantes posibilidades en diversos ámbitos que dependen de la conversión rápida de 2D a 3D.
❓ Preguntas frecuentes (FAQ)
- P: ¿Qué es TripoSR?
- A: TripoSR es un modelo avanzado de reconstrucción de imágenes a 3D desarrollado por Stability AI y Tripo AI. Genera mallas 3D de alta calidad a partir de una sola imagen RGB 2D de forma muy rápida.
- P: ¿Con qué rapidez puede TripoSR generar un modelo 3D?
- R: Puede generar una malla 3D en menos de 0,5 segundos cuando se ejecuta en una GPU NVIDIA A100, lo que la convierte en una de las soluciones más rápidas disponibles.
- P: ¿Qué tipo de datos de entrada requiere TripoSR?
- A: TripoSR solo requiere una única imagen RGB para realizar la reconstrucción de objetos 3D.
- P: ¿Cuáles son las principales aplicaciones de TripoSR?
- R: Es ideal para aplicaciones en entretenimiento, videojuegos, diseño industrial y arquitectura, donde la visualización 3D rápida a partir de imágenes 2D es crucial.
- P: ¿Cuál es la licencia de TripoSR?
- A: TripoSR se distribuye bajo la permisiva licencia MIT, que permite su uso con fines comerciales, personales y de investigación, promoviendo un desarrollo de IA abierto y responsable.
Campo de juegos de IA



Acceso