Afuera

Charlar

desactivar

Llama Guard 3 11B Vision Turbo

Llama Guard 3 Vision es un modelo multimodal de seguridad de contenido para detectar mensajes de texto e imágenes dañinos, lo que garantiza una IA responsable.

Fichas de $1 gratis para nuevos miembros

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'meta-llama/Llama-Guard-3-11B-Vision-Turbo',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="meta-llama/Llama-Guard-3-11B-Vision-Turbo",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.

Obtén la clave API Explorar modelos

Llama Guard 3 11B Vision Turbo

Detalles del producto

ⓘ Descripción general: Llama Guard 3 11B Vision

Llama Guard 3 11B Visión es un clasificador de seguridad de contenido multimodal de vanguardia desarrollado por Meta. Publicado el 6 de diciembre de 2023Este modelo de la versión 3.2 de Llama está diseñado específicamente para mejorar la seguridad de las aplicaciones de modelos de lenguaje a gran escala (LLM, por sus siglas en inglés) mediante la detección de contenido dañino tanto en las entradas de texto como en las respuestas de imagen.

✓ Nombre del modelo: Llama Guard 3 11B Visión
✓ Revelador: Meta
✓ Fecha de lanzamiento: 6 de diciembre de 2023
✓ Tipo de modelo: Clasificador de seguridad de contenido multimodal (texto e imagen)

🔍 Características clave para una mayor seguridad en LLM

Este modelo aporta avances significativos a la moderación de contenido, especialmente en escenarios multimodales complejos, garantizando interacciones más seguras con la IA.

Detección de contenido dañino: Identifica contenido inapropiado o inseguro tanto en textos como en imágenes, protegiendo así las interacciones de LLM.
Optimizado para el razonamiento de imágenes: Destaca en situaciones donde el contexto visual es crucial para una clasificación de seguridad precisa.
Resultados de seguridad detallados: Genera resultados de texto claros que indican los niveles de seguridad y las categorías específicas de contenido infringido para obtener información útil.
Rendimiento superior: Supera a modelos líderes como GPT-4o y GPT-4o mini en la clasificación de respuestas, presentando tasas de falsos positivos significativamente más bajas.

💬 Uso previsto y soporte lingüístico

Llama Guard 3 11B Vision está diseñado principalmente para casos de uso que requieren una detección robusta de contenido dañino en entradas y respuestas multimodales. Es una herramienta esencial para desarrolladores y organizaciones que buscan garantizar la seguridad y el uso ético de sus aplicaciones LLM.

💬 Aplicación principal: Protección de las aplicaciones LLM contra contenido multimodal dañino.
💬 Idioma optimizado: Desarrollado y optimizado principalmente para el idioma en Inglés.

📚 Análisis técnico en profundidad

Comprender la arquitectura y la metodología de capacitación revela la solidez y las capacidades avanzadas de Llama Guard 3 11B Vision.

Arquitectura

El modelo se basa en un Modelo preentrenado Llama-3.2-11B, que ha sido meticulosamente perfeccionado específicamente para tareas de clasificación de seguridad de contenido, aprovechando sus potentes capacidades fundamentales para lograr una precisión superior.

Estrategia de datos de capacitación

El régimen de entrenamiento utilizó un método sofisticado. conjunto de datos híbridoEste conjunto de datos combina datos generados por humanos y datos generados sintéticamente, lo que garantiza una cobertura integral de diversos escenarios dañinos y mejora su aplicabilidad en el mundo real. Incluye:

Indicaciones creadas por humanos acompañado de diversas imágenes correspondientes.
Respuestas benignas y que violan el modelo Generado mediante modelos Llama propios y técnicas avanzadas de jailbreaking para simular ataques adversarios del mundo real.

Fuente y tamaño de los datos

El conjunto de datos es excepcionalmente diverso, con una amplia gama de pares de imágenes y mensajes. Estos pares están meticulosamente etiquetados, ya sea por anotadores humanos o por sistemas avanzados. Modelo Llama 3.1 405BLos datos abarcan todas las categorías de peligro definidas por MLCommons, lo que garantiza una base de entrenamiento amplia y completa. Para el procesamiento de imágenes, el codificador de visión redimensiona eficientemente las imágenes en 4 fragmentos, cada uno de los cuales mide 560x560 píxeles.

Diversidad y mitigación de prejuicios

Compromiso con la diversidad: El proceso de curación priorizó la creación de un conjunto de datos que reflejara fielmente una amplia gama de pares de imágenes y avisos, abarcando todas las categorías de riesgo definidas para minimizar el sesgo y mejorar la detección robusta en diversos escenarios.

📈 Métricas de rendimiento y evaluación comparativa

La eficacia de Llama Guard 3 11B Vision se evalúa rigurosamente mediante un conjunto de pruebas internas que se ajustan a la taxonomía de riesgos de MLCommons. El modelo ofrece un rendimiento y una fiabilidad excelentes de forma constante.

Resultados excepcionales en la F1: Llama Guard 3 Vision logra puntuaciones F1 superiores 0,69 En todas las categorías de riesgo, incluidas áreas complejas como las armas indiscriminadas y las elecciones, demostrando una alta precisión y fiabilidad en todos los ámbitos.

Conjunto de pruebas internas para el rendimiento de Llama Guard 3 Vision — Conjunto de pruebas internas para Llama Guard 3 Vision

Comparación con otros modelos de la industria

En comparaciones directas, Llama Guard 3 Vision demuestra capacidades superiores frente a modelos destacados como GPT-4o y GPT-4o mini. Esta superioridad es particularmente evidente en la clasificación de respuestas, donde logra puntuaciones F1 más altas y tasas de falsos positivos significativamente menores. El diseño del modelo minimiza eficazmente los ataques basados en indicaciones al basarse más en la respuesta del modelo para la clasificación, abordando con mayor precisión la ambigüedad inherente de las indicaciones combinadas de texto e imagen.

Comparación de Flame Guard 3 Vision con GPT-4o y GPT-4o Mini — Comparación de la visión de Llama Guard 3

🔑 Uso y acceso a la API

Integrar Llama Guard 3 11B Vision en sus aplicaciones es sencillo, ya que proporciona funciones robustas de seguridad de contenido con facilidad.

Ejemplos de código:

El modelo está fácilmente disponible en el Plataforma API de IA/ML bajo el identificador "Llama-Guard-3-11B-Vision-Turbo"Acceda a la API aquí para empezar.

Documentación de la API:

Para obtener orientación técnica detallada, instrucciones de integración e información completa, consulte el sitio web oficial. Documentación de la API.

📒 Directrices éticas y limitaciones

Es fundamental comprender las consideraciones éticas y las limitaciones específicas asociadas con Llama Guard 3 11B Vision para una implementación responsable y eficaz en sus aplicaciones.

Nota importante: Llama Guard 3 Vision está optimizado en Llama 3.2-vision. Su rendimiento y capacidades están intrínsecamente ligados a sus datos de preentrenamiento. no es intencional para servir como un clasificador de seguridad de imágenes independiente o un clasificador de seguridad solo de texto. Está diseñado para seguridad de contenido multimodal específicamente en el contexto de las aportaciones y respuestas del LLM para proporcionar una defensa por capas.

Para comenzar a aprovechar las potentes capacidades de la API Llama Guard 3 11B Vision Turbo, puede Comience aquí.

ⓘ Preguntas frecuentes (FAQ)

P1: ¿Qué es Llama Guard 3 11B Vision?: A1: Es un modelo de clasificación de seguridad de contenido multimodal desarrollado por Meta, diseñado específicamente para detectar contenido de texto e imagen dañino en entradas y respuestas de modelos de lenguaje grandes (LLM).
P2: ¿Qué tipos de contenido puede detectar Llama Guard 3 11B Vision?: A2: Está diseñado para detectar contenido dañino tanto en formatos de texto como de imagen, lo que lo hace altamente efectivo para la seguridad y la moderación de contenido de LLM multimodal.
P3: ¿Cómo se compara su rendimiento con el de otros modelos de seguridad como el GPT-4o?: A3: Llama Guard 3 Vision demuestra un rendimiento superior en comparación con GPT-4o y GPT-4o mini, particularmente en la clasificación de respuestas, logrando puntuaciones F1 más altas y tasas de falsos positivos significativamente más bajas.
P4: ¿Es Llama Guard 3 11B Vision adecuado para la clasificación independiente de solo texto o solo imagen?: A4: No, está diseñado y optimizado específicamente para la seguridad del contenido multimodal dentro de contextos LLM y no está pensado para usarse como un clasificador independiente solo de texto o solo de imagen.
P5: ¿Cómo puedo acceder a la API de Llama Guard 3 11B Vision?: A5: El modelo está disponible en la plataforma API de IA/ML con el identificador "Llama-Guard-3-11B-Vision-Turbo". Puede encontrar el acceso y la documentación detallada en el sitio web oficial de la plataforma.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.

Pruébalo gratis

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos

Fichas de $1 gratis para nuevos miembros