qwen-bg
max-ico04
En
Afuera
max-ico02
Charlar
max-ico03
desactivar
TripoSR 3D estable
La API de TripoSR genera mallas 3D de alta calidad a partir de imágenes individuales en menos de 0,5 segundos, utilizando una arquitectura de transformador para una reconstrucción eficiente.
Tokens gratis de $1 para nuevos miembros
Text to Speech
                                        const fs = require('fs');
const { Readable } = require('stream');
const { finished } = require('stream/promises');

const main = async () => {
  const {
    model_mesh: { url, file_name },
  } = await fetch('https://api.ai.cc/v1/image/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'triposr',
      image_url: 'https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png',
    }),
  }).then((res) => res.json());

  const { body } = await fetch(url);
  const stream = fs.createWriteStream(`./${file_name}`);
  await finished(Readable.fromWeb(body).pipe(stream));
};

main();
                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "triposr",
            "image_url": "https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png",
        },
    )

    response.raise_for_status()
    data = response.json()
    url = data["model_mesh"]["url"]
    file_name = data["model_mesh"]["file_name"]

    mesh_response = requests.get(url, stream=True)

    with open(file_name, "wb") as file:
        for chunk in mesh_response.iter_content(chunk_size=8192):
            file.write(chunk)


if __name__ == "__main__":
    main()
Docs

Una API con más de 300 modelos de IA

Ahorre un 20% en costos y $1 en tokens gratis
qwenmax-bg
imagen
TripoSR 3D estable

Detalle del producto

Presentamos TripoSR: Revolucionando la reconstrucción de imágenes en 3D

TripoSR es un modelo innovador basado en transformador desarrollado conjuntamente por IA de estabilidad y Tripo AILanzado el 4 de marzo de 2024, este modelo de la versión 1.0 establece un nuevo estándar para la reconstrucción rápida de objetos 3D. Destaca en la generación de mallas 3D de alta calidad a partir de una sola imagen RGB, logrando esta hazaña en menos de... 0,5 segundos en una GPU NVIDIA A100.

💡 Capacidades y características clave

  • 🚀 Generación ultrarrápida: Logra una generación 3D con avance en menos de 0,5 segundos.
  • 🧠 Arquitectura avanzada de transformadores: Utiliza un diseño de transformador eficiente para un procesamiento sofisticado.
  • Mallas 3D de alta calidad: Produce salidas de malla 3D detalladas y precisas.
  • 🖼️ Entrada de imagen única: Simplifica el proceso al requerir solo una imagen RGB.
  • 🏆 Rendimiento de última generación: Lidera las métricas de distancia de chaflán y puntuación F frente a sus competidores.

🎯 Aplicaciones previstas

TripoSR está diseñado para sectores que exigen una visualización 3D rápida directamente desde imágenes 2D. Sus principales aplicaciones incluyen:

  • Entretenimiento: Para la creación rápida de activos en películas y animación.
  • Juego de azar: Prototipado rápido y generación de activos de juegos.
  • Diseño industrial: Visualización acelerada de conceptos de productos.
  • Arquitectura: Conversión rápida de bocetos o fotografías arquitectónicas en modelos 3D.

Al ser un modelo de imagen a 3D, TripoSR funciona independientemente de los lenguajes humanos, lo que lo hace universalmente aplicable.

⚙️ Análisis técnico profundo

Arquitectura del modelo

La sofisticada arquitectura de TripoSR es una combinación de componentes basados ​​en transformadores, meticulosamente optimizados para una reconstrucción 3D superior:

  1. Codificador de imágenes:
    • Utiliza un transformador de visión preentrenado DINOv1.
    • Transforma imágenes RGB en vectores latentes, capturando características tanto globales como locales.
  2. Decodificador de imagen a triplano:
    • Un decodificador basado en transformador.
    • Convierte vectores latentes en una representación NeRF (campo de radiancia neuronal) triplano.
    • Emplea mecanismos de atención avanzados para aprender relaciones complejas entre los componentes del triplano.
  3. Campo de radiancia neuronal basado en triplano (NeRF):
    • La etapa final generando la representación 3D.
    • Específicamente optimizado para manejar formas y texturas complejas de manera efectiva.

Datos de entrenamiento

El modelo fue entrenado rigurosamente en un subconjunto cuidadosamente seleccionado del expansivo Conjunto de datos publicado, elegido específicamente por su enfoque en modelos 3D realistas y de alta calidad.

Métricas de rendimiento

TripoSR supera consistentemente a otras alternativas de código abierto tanto en evaluaciones cuantitativas como cualitativas. Demuestra un rendimiento excepcional en métricas críticas como Distancia del chaflán y Puntuación F en una amplia gama de conjuntos de datos diversos.

📊 Comparación con otros modelos

  • ✔️ Exactitud: Ofrece una calidad de reconstrucción 3D superior en comparación con otras soluciones de código abierto.
  • Velocidad: Genera mallas 3D complejas en menos de 0,5 segundos en una GPU NVIDIA A100.
  • 🛡️ Robustez: Muestra una notable adaptabilidad a diversas condiciones de imagen al inferir los parámetros de la cámara de forma dinámica, sin depender de un condicionamiento explícito.

🛠️ Uso y licencias

Ejemplos de código

Para los desarrolladores que buscan integrar TripoSR, hay ejemplos de código y documentación disponibles. Puedes... Explora el anuncio oficial y los recursos de TripoSR para guías de implementación detalladas.

Pautas éticas y licencias

TripoSR se publica bajo la licencia permisiva Licencia MITEsto promueve el desarrollo de código abierto y fomenta la implementación responsable en diversos campos, como la inteligencia artificial, la visión artificial y las aplicaciones de gráficos por computadora. La Licencia MIT permite un amplio uso, que abarca aplicaciones comerciales, personales y de investigación.

Al aprovechar las capacidades avanzadas de TripoSR, los desarrolladores pueden crear potentes aplicaciones de reconstrucción 3D con una velocidad y precisión sin precedentes. Este avance abre nuevas y emocionantes posibilidades en diversos ámbitos que dependen de la rápida conversión de 2D a 3D.

Preguntas frecuentes (FAQ)

P: ¿Qué es TripoSR?
R: TripoSR es un modelo avanzado de reconstrucción de imagen a 3D desarrollado por Stability AI y Tripo AI. Genera mallas 3D de alta calidad a partir de una sola imagen RGB 2D con gran rapidez.
P: ¿Qué tan rápido puede TripoSR generar un modelo 3D?
R: Puede generar una malla 3D en menos de 0,5 segundos cuando se ejecuta en una GPU NVIDIA A100, lo que la convierte en una de las soluciones más rápidas disponibles.
P: ¿Qué tipo de entrada requiere TripoSR?
R: TripoSR solo requiere una única imagen RGB para realizar la reconstrucción de objetos 3D.
P: ¿Cuáles son las principales aplicaciones de TripoSR?
R: Es ideal para aplicaciones de entretenimiento, juegos, diseño industrial y arquitectura donde la visualización 3D rápida a partir de imágenes 2D es crucial.
P: ¿Cuál es la licencia para TripoSR?
R: TripoSR se publica bajo la licencia permisiva MIT, que permite su uso para fines comerciales, personales y de investigación, promoviendo el desarrollo de una IA abierta y responsable.

Patio de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Una API
Más de 300 modelos de IA

Ahorre un 20% en costos