qwen-bg
max-ico04
Dans
Dehors
max-ico02
Chat
max-ico03
désactiver
TripoSR 3D stable
L'API TripoSR génère des maillages 3D de haute qualité à partir d'images uniques en moins de 0,5 seconde, grâce à une architecture de transformateur pour une reconstruction efficace.
Jetons gratuits de 1 $ pour les nouveaux membres
Text to Speech
                                        const fs = require('fs');
const { Readable } = require('stream');
const { finished } = require('stream/promises');

const main = async () => {
  const {
    model_mesh: { url, file_name },
  } = await fetch('https://api.ai.cc/v1/image/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'triposr',
      image_url: 'https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png',
    }),
  }).then((res) => res.json());

  const { body } = await fetch(url);
  const stream = fs.createWriteStream(`./${file_name}`);
  await finished(Readable.fromWeb(body).pipe(stream));
};

main();
                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "triposr",
            "image_url": "https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png",
        },
    )

    response.raise_for_status()
    data = response.json()
    url = data["model_mesh"]["url"]
    file_name = data["model_mesh"]["file_name"]

    mesh_response = requests.get(url, stream=True)

    with open(file_name, "wb") as file:
        for chunk in mesh_response.iter_content(chunk_size=8192):
            file.write(chunk)


if __name__ == "__main__":
    main()
Docs

Une seule API pour plus de 300 modèles d'IA

Économisez 20 % sur les coûts et recevez des jetons gratuits d'une valeur de 1 $.
qwenmax-bg
image
TripoSR 3D stable

Détails du produit

Présentation de TripoSR : une révolution dans la reconstruction d’images en 3D

TripoSR est un modèle révolutionnaire basé sur un transformateur, développé conjointement par IA de stabilité et Tripo AISortie le 4 mars 2024, cette version 1.0 établit une nouvelle norme pour la reconstruction rapide d'objets 3D. Elle excelle dans la génération de maillages 3D de haute qualité à partir d'une simple image RVB, et ce en moins de 10 secondes. 0,5 seconde sur un GPU NVIDIA A100.

💡 Principales fonctionnalités

  • 🚀 Génération ultra-rapide : Génère une image 3D en anticipation en moins de 0,5 seconde.
  • 🧠 Architecture avancée des transformateurs : Utilise une conception de transformateur efficace pour un traitement sophistiqué.
  • Maillages 3D de haute qualité : Génère des maillages 3D détaillés et précis.
  • 🖼️ Saisie d'une seule image : Simplifie le processus en ne nécessitant qu'une seule image RVB.
  • 🏆 Performances de pointe : En tête des indicateurs de distance de chanfrein et de score F par rapport à la concurrence.

🎯 Applications prévues

TripoSR est conçu pour les secteurs exigeant une visualisation 3D rapide directement à partir d'images 2D. Ses principales applications sont les suivantes :

  • Divertissement: Pour la création rapide d'éléments graphiques dans le cinéma et l'animation.
  • Jeux vidéo : Prototypage rapide et génération d'éléments de jeu.
  • Dessin industriel: Visualisation accélérée des concepts de produits.
  • Architecture: Conversion rapide d'esquisses ou de photos architecturales en modèles 3D.

TripoSR, étant un modèle image-3D, fonctionne indépendamment des langues humaines, ce qui le rend universellement applicable.

⚙️ Analyse technique approfondie

Architecture du modèle

L'architecture sophistiquée de TripoSR est un mélange de composants à base de transformateurs, méticuleusement optimisés pour une reconstruction 3D supérieure :

  1. Encodeur d'images :
    • Utilise un transformateur de vision pré-entraîné DINOv1.
    • Transforme les images RGB en vecteurs latents, capturant à la fois les caractéristiques globales et locales.
  2. Décodeur image-triplan :
    • Un décodeur à transformateur.
    • Convertit les vecteurs latents en une représentation triplane NeRF (Neural Radiance Field).
    • Utilise des mécanismes d'attention avancés pour apprendre les relations complexes entre les composants triplanaires.
  3. Champ de radiance neuronale basé sur un triplan (NeRF) :
    • L'étape finale consiste à générer la représentation 3D.
    • Spécialement optimisé pour gérer efficacement les formes et les textures complexes.

Données d'entraînement

Le modèle a été rigoureusement entraîné sur un sous-ensemble soigneusement sélectionné de l'ensemble de données exhaustif. Ensemble de données publié, choisi spécifiquement pour son orientation vers des modèles 3D réalistes et de haute qualité.

Indicateurs de performance

TripoSR surpasse systématiquement les autres solutions open source, tant sur le plan quantitatif que qualitatif. Il affiche des performances exceptionnelles sur des indicateurs clés tels que : Distance de chanfrein et Score F sur un large éventail d'ensembles de données divers.

📊 Comparaison avec d'autres modèles

  • ✔️ Précision: Offre une qualité de reconstruction 3D supérieure à celle des autres solutions open source.
  • Vitesse: Génère des maillages 3D complexes en moins de 0,5 seconde sur un GPU NVIDIA A100.
  • 🛡️ Robustesse : Elle présente une remarquable adaptabilité à diverses conditions d'imagerie en déduisant dynamiquement les paramètres de la caméra, sans avoir recours à un conditionnement explicite.

🛠️ Utilisation et licence

Exemples de code

Pour les développeurs souhaitant intégrer TripoSR, des exemples de code et de la documentation sont disponibles. Découvrez l'annonce officielle et les ressources de TripoSR pour des guides de mise en œuvre détaillés.

Lignes directrices éthiques et agrément

TripoSR est distribué sous licence permissive Licence MITCela favorise le développement open source et encourage une mise en œuvre responsable dans divers domaines, notamment l'IA, la vision par ordinateur et l'infographie. La licence MIT autorise une large utilisation, couvrant les applications commerciales, personnelles et de recherche.

Grâce aux capacités avancées de TripoSR, les développeurs peuvent créer des applications de reconstruction 3D performantes avec une rapidité et une précision inégalées. Cette avancée majeure ouvre de nouvelles perspectives passionnantes dans divers domaines nécessitant une conversion rapide de la 2D vers la 3D.

Foire aux questions (FAQ)

Q : Qu'est-ce que TripoSR ?
A: TripoSR est un modèle avancé de reconstruction 3D à partir d'images, développé par Stability AI et Tripo AI. Il génère très rapidement des maillages 3D de haute qualité à partir d'une seule image RGB 2D.
Q : À quelle vitesse TripoSR peut-il générer un modèle 3D ?
R: Il peut générer un maillage 3D en moins de 0,5 seconde lorsqu'il est exécuté sur un GPU NVIDIA A100, ce qui en fait l'une des solutions les plus rapides disponibles.
Q : De quel type d'entrée TripoSR a-t-il besoin ?
A: TripoSR ne nécessite qu'une seule image RGB pour effectuer la reconstruction d'un objet 3D.
Q : Quelles sont les principales applications de TripoSR ?
A: Il est idéal pour les applications dans les domaines du divertissement, des jeux vidéo, du design industriel et de l'architecture, où la visualisation 3D rapide à partir d'images 2D est cruciale.
Q : Quelle est la licence pour TripoSR ?
A: TripoSR est distribué sous la licence permissive MIT, qui autorise son utilisation à des fins commerciales, personnelles et de recherche, promouvant ainsi un développement de l'IA ouvert et responsable.

Terrain de jeu de l'IA

Testez tous les modèles d'API dans l'environnement de test avant de les intégrer. Nous proposons plus de 300 modèles à intégrer à votre application.
Essai gratuit
api-droite-1
modèle-bg02-1

Une API
Plus de 300 modèles d'IA

Économisez 20 % sur vos coûts