qwen-bg
max-ico04
Dans
Dehors
max-ico02
Chat
max-ico03
désactiver
Llama Guard 3 11B Vision Turbo
Llama Guard 3 Vision est un modèle de sécurité de contenu multimodal permettant de détecter les messages textuels et visuels nuisibles, garantissant ainsi une IA responsable.
Jetons gratuits de 1 $ pour les nouveaux membres
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'meta-llama/Llama-Guard-3-11B-Vision-Turbo',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="meta-llama/Llama-Guard-3-11B-Vision-Turbo",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

Une seule API pour plus de 300 modèles d'IA

Économisez 20 % sur les coûts et recevez des jetons gratuits d'une valeur de 1 $.
qwenmax-bg
image
Llama Guard 3 11B Vision Turbo

Détails du produit

ⓘ Aperçu : Llama Guard 3 11B Vision

Llama Guard 3 11B Vision est un classificateur de sécurité de contenu multimodal de pointe développé par MétaSorti le 6 décembre 2023, ce modèle Llama 3.2 est spécialement conçu pour améliorer la sécurité des applications Large Language Model (LLM) en détectant les contenus nuisibles dans les entrées et les réponses textuelles et visuelles.

  • Nom du modèle : Llama Guard 3 11B Vision
  • Promoteur: Méta
  • Date de sortie : 6 décembre 2023
  • Type de modèle : Classificateur de sécurité de contenu multimodal (texte et image)

🔍 Principales caractéristiques pour une sécurité LLM améliorée

Ce modèle apporte des avancées significatives à la modération de contenu, notamment dans les scénarios multimodaux complexes, garantissant des interactions IA plus sûres.

  • Détection de contenu nuisible : Identifie les contenus inappropriés ou dangereux dans les entrées texte et image, protégeant ainsi les interactions LLM.
  • Optimisé pour le raisonnement par l'image : Excellente performance dans les situations où le contexte visuel est crucial pour une classification de sécurité précise.
  • Résultats détaillés en matière de sécurité : Génère des résultats textuels clairs indiquant les niveaux de sécurité et les catégories de contenu spécifiques violées pour des informations exploitables.
  • Performances supérieures : Surpasse les modèles de référence comme GPT-4o et GPT-4o mini en matière de classification des réponses, avec des taux de faux positifs nettement inférieurs.

💬 Utilisation prévue et assistance linguistique

Llama Guard 3 11B Vision est principalement conçu pour les cas d'utilisation exigeant une détection robuste des contenus nuisibles au sein des entrées et réponses multimodales. C'est un outil essentiel pour les développeurs et les organisations qui souhaitent garantir la sécurité et l'utilisation éthique de leurs applications LLM.

  • 💬 Application principale : Sécuriser les applications LLM contre les contenus multimodaux nuisibles.
  • 💬 Langage optimisé : Principalement développé et optimisé pour le langue anglaise.

📚 Analyse technique approfondie

Comprendre l'architecture et la méthodologie de formation révèle la robustesse et les capacités avancées de Llama Guard 3 11B Vision.

Architecture

Le modèle est construit sur un Modèle pré-entraîné Llama-3.2-11B, qui a été méticuleusement mise au point spécifiquement pour les tâches de classification de la sécurité du contenu, tirant parti de ses puissantes capacités fondamentales pour une précision supérieure.

Stratégie de données d'entraînement

Le programme d'entraînement utilisait un système sophistiqué ensemble de données hybridesCet ensemble de données combine des données générées par l'homme et des données synthétiques, assurant une couverture exhaustive de divers scénarios dangereux et améliorant son applicabilité concrète. Il comprend :

  • Invites créées par l'homme associée à diverses images correspondantes.
  • Réponses au modèle bénignes et non bénignes générés à l'aide de modèles Llama internes et de techniques de jailbreak avancées pour simuler des attaques adverses réelles.

Source et taille des données

L'ensemble de données est exceptionnellement diversifié et comprend un large éventail de paires image-invite. Ces paires sont méticuleusement étiquetées, soit par des annotateurs humains, soit par un système avancé. Modèle Llama 3.1 405BLes données englobent toutes les catégories de risques définies par MLCommons, garantissant ainsi une base de formation large et approfondie. Pour le traitement d'images, l'encodeur visuel redimensionne efficacement les images en 4 blocs, chacun mesurant 560x560 pixels.

Diversité et atténuation des préjugés

Engagement en faveur de la diversité : Le processus de sélection a privilégié la création d'un ensemble de données reflétant véritablement une grande diversité de paires image-invite, couvrant toutes les catégories de danger définies afin de minimiser les biais et d'améliorer la détection robuste dans divers scénarios.

📈 Indicateurs de performance et analyse comparative

L'efficacité de Llama Guard 3 11B Vision est rigoureusement évaluée à l'aide d'un ensemble de tests internes conformes à la taxonomie des risques MLCommons. Le modèle offre systématiquement des performances et une fiabilité élevées.

Résultats exceptionnels en F1 : Llama Guard 3 Vision atteint des scores F1 supérieurs à la moyenne. 0,69 dans toutes les catégories de risques, y compris dans des domaines complexes comme les armes indiscriminées et les élections, faisant preuve d'une grande précision et d'une fiabilité à toute épreuve.

Tests internes pour évaluer les performances de Llama Guard 3 Vision
Ensemble de tests internes pour Llama Guard 3 Vision

Comparaison avec d'autres modèles du secteur

Dans les comparaisons directes, Llama Guard 3 Vision démontre des capacités supérieures Ce modèle se distingue par sa supériorité face à des modèles reconnus comme GPT-4o et GPT-4o mini. Cette supériorité est particulièrement manifeste dans la classification des réponses, où il obtient des scores F1 plus élevés et des taux de faux positifs nettement inférieurs. Sa conception minimise efficacement les attaques par incitation en s'appuyant davantage sur la réponse du modèle pour la classification, ce qui permet de gérer avec une plus grande précision l'ambiguïté inhérente aux incitations combinant texte et image.

Comparaison du Flame Guard 3 Vision avec le GPT-4o et le GPT-4o Mini
Comparaison des visions du Llama Guard 3

🔑 Utilisation et accès à l'API

L'intégration de Llama Guard 3 11B Vision dans vos applications est simple et offre des fonctionnalités de sécurité du contenu robustes en toute simplicité.

Exemples de code :

Le modèle est facilement disponible sur le Plateforme API IA/ML sous l'identifiant "Llama-Guard-3-11B-Vision-Turbo"Accédez à l'API ici pour commencer.

Documentation de l'API :

Pour des instructions techniques détaillées, des instructions d'intégration et des informations complètes, veuillez consulter le site officiel. Documentation de l'API.

📒 Principes et limites éthiques

Il est crucial de comprendre les considérations éthiques et les limitations spécifiques associées à Llama Guard 3 11B Vision pour un déploiement responsable et efficace au sein de vos applications.

Remarque importante : Llama Guard 3 Vision est une version optimisée de Llama 3.2-vision. Ses performances et ses capacités sont intrinsèquement liées à ses données de pré-entraînement. non intentionnel Il est conçu pour servir de classificateur de sécurité d'images autonome ou de classificateur de sécurité textuel. sécurité du contenu multimodal plus particulièrement dans le contexte des contributions et des réponses du LLM pour assurer une défense à plusieurs niveaux.

Pour commencer à exploiter les puissantes fonctionnalités de Llama Guard 3 11B Vision Turbo API, vous pouvez Commencez ici.

ⓘ Foire aux questions (FAQ)

Q1 : Qu'est-ce que Llama Guard 3 11B Vision ?
A1 : Il s'agit d'un modèle de classification de sécurité de contenu multimodal développé par Meta, spécifiquement conçu pour détecter le contenu textuel et image nuisible dans les entrées et les réponses du Large Language Model (LLM).
Q2 : Quels types de contenu Llama Guard 3 11B Vision peut-il détecter ?
A2 : Il est conçu pour détecter les contenus nuisibles dans les formats texte et image, ce qui le rend très efficace pour la sécurité multimodale des LLM et la modération des contenus.
Q3 : Comment ses performances se comparent-elles à celles d'autres modèles de sécurité comme le GPT-4o ?
A3 : Llama Guard 3 Vision démontre des performances supérieures à celles de GPT-4o et GPT-4o mini, notamment en matière de classification des réponses, atteignant des scores F1 plus élevés et des taux de faux positifs significativement plus faibles.
Q4 : Llama Guard 3 11B Vision convient-il à une classification autonome de texte uniquement ou d'images uniquement ?
A4 : Non, il est spécifiquement conçu et optimisé pour la sécurité du contenu multimodal dans les contextes LLM et n’est pas destiné à être utilisé comme classificateur autonome de texte uniquement ou d’image uniquement.
Q5 : Comment puis-je accéder à l'API Llama Guard 3 11B Vision ?
A5 : Le modèle est disponible sur la plateforme d’API IA/ML sous l’identifiant « Llama-Guard-3-11B-Vision-Turbo ». Vous trouverez l’accès et une documentation détaillée sur le site web officiel de la plateforme.

Terrain de jeu de l'IA

Testez tous les modèles d'API dans l'environnement de test avant de les intégrer. Nous proposons plus de 300 modèles à intégrer à votre application.
Essai gratuit
api-droite-1
modèle-bg02-1

Une API
Plus de 300 modèles d'IA

Économisez 20 % sur vos coûts