



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'meta-llama/Llama-Guard-3-11B-Vision-Turbo',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="meta-llama/Llama-Guard-3-11B-Vision-Turbo",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

产品详情
ⓘ 概述:Llama Guard 3 11B 视觉
羊驼卫士 3 11B 视觉 是由开发的尖端多模态内容安全分类器 元已发布 2023年12月6日Llama 3.2 版本模型经过专门设计,能够检测文本和图像输入及响应中的有害内容,从而增强大型语言模型 (LLM) 应用程序的安全性。
- ✓ 型号名称: 羊驼卫士 3 11B 视觉
- ✓ 开发者: 元
- ✓ 发布日期: 2023年12月6日
- ✓ 型号: 多模态(文本和图像)内容安全分类器
🔍 增强LLM安全性的关键特性
该模型为内容审核带来了重大进步,尤其是在复杂的多模态场景中,确保了更安全的 AI 交互。
- 有害内容检测: 识别文本和图像输入中的不当或不安全内容,保障 LLM 交互安全。
- 针对图像推理进行了优化: 在视觉环境对准确安全分类至关重要的场景中表现出色。
- 详细安全输出: 生成清晰的文本输出,指示安全级别和具体的违规内容类别,以便获得可操作的见解。
- 卓越的性能: 在响应分类方面,其性能优于 GPT-4o 和 GPT-4o mini 等领先模型,具有显著更低的误报率。
💬 预期用途和语言支持
Llama Guard 3 11B Vision 主要面向需要对多模态输入和响应中的有害内容进行可靠检测的应用场景。对于旨在确保其 LLM 应用安全合规使用的开发者和组织而言,它是一款必不可少的工具。
- 💬 主要应用: 保护LLM应用程序免受有害多模态内容的侵害。
- 💬 优化语言: 主要为以下用途而开发和优化 英语。
📚 技术深度解析
了解架构和训练方法,就能发现 Llama Guard 3 11B Vision 的稳健性和先进功能。
建筑学
该模型建立在……之上 Llama-3.2-11B 预训练模型该软件经过精心调整,专门用于内容安全分类任务,利用其强大的基础功能实现卓越的准确性。
训练数据策略
该训练方案采用了一种复杂的 混合数据集该数据集结合了人工生成数据和合成生成数据,确保全面覆盖各种有害场景,并提高其在实际应用中的适用性。它包括:
- 人为创建的提示 配以各种相应的图片。
- 良性和违反模型反应 使用内部 Llama 模型和先进的越狱技术生成,以模拟现实世界的对抗性攻击。
数据来源和规模
该数据集种类极其丰富,包含各种各样的提示图像对。这些图像对都经过人工标注或高级标注工具的精心标注。 Llama 3.1 405B 型号数据涵盖了所有由以下因素定义的危险类别: MLCommons从而确保了广泛而全面的训练基础。对于图像处理,视觉编码器高效地将图像重新缩放为 4 个 560x560 像素的图像块。
多样性和偏见缓解
对多元化的承诺: 整理过程优先考虑创建一个真正反映各种提示图像对的数据集,涵盖所有已定义的危险类别,以最大限度地减少偏差并增强在各种场景下的稳健检测。
📈 性能指标与基准测试
Llama Guard 3 11B Vision 的有效性经过严格评估,评估依据是符合 MLCommons 风险分类标准的内部测试集。该模型始终表现出强大的性能和可靠性。
卓越的F1成绩: Llama Guard 3 Vision 的 F1 得分超过 0.69 在所有危险类别中,包括无差别武器和选举等具有挑战性的领域,都表现出高度的准确性和可靠性。

与其他行业型号的比较
在直接对比中, Llama Guard 3 Vision展现出卓越的性能 与 GPT-4o 和 GPT-4o mini 等知名模型相比,该模型具有显著优势。这种优势在响应分类方面尤为明显,其 F1 分数更高,误报率也显著降低。该模型的设计通过更多地依赖模型响应进行分类,有效地减少了基于提示的攻击,从而更精确地解决了文本和图像组合提示固有的歧义问题。

🔑 使用方法和 API 访问
将 Llama Guard 3 11B Vision 集成到您的应用程序中非常简单,可以轻松提供强大的内容安全功能。
代码示例:
该模型很容易获取。 AI/ML API平台 在标识符下 “Llama-Guard-3-11B-Vision-Turbo”访问 API 这里 开始吧。
API文档:
有关详细技术指导、集成说明和全面信息,请参阅官方文档。 API 文档。
📒 道德准则与限制
了解与 Llama Guard 3 11B Vision 相关的伦理考量和具体限制,对于在您的应用程序中进行负责任和有效的部署至关重要。
重要提示: Llama Guard 3 Vision 基于 Llama 3.2 Vision 进行了微调。其性能和功能与其预训练数据密切相关。 并非有意为之 可作为独立的图像安全分类器或纯文本安全分类器使用。它的设计用途是 多模态内容安全 具体而言,是在LLM输入和响应的背景下,以提供分层防御。
要开始利用 Llama Guard 3 11B Vision Turbo API 的强大功能,您可以…… 从这里开始。
ⓘ 常见问题解答 (FAQ)
- Q1:什么是 Llama Guard 3 11B Vision?
- A1:这是一个由 Meta 开发的多模态内容安全分类模型,专门用于检测大型语言模型 (LLM) 输入和响应中的有害文本和图像内容。
- Q2:Llama Guard 3 11B Vision 可以检测哪些类型的内容?
- A2:它经过专门设计,可以检测文本和图像格式中的有害内容,因此对多模态LLM安全和内容审核非常有效。
- Q3:它的性能与其他安全模型(如 GPT-4o)相比如何?
- A3:Llama Guard 3 Vision 的性能优于 GPT-4o 和 GPT-4o mini,尤其是在响应分类方面,获得了更高的 F1 分数和显著更低的假阳性率。
- Q4:Llama Guard 3 11B Vision 是否适用于独立的纯文本或纯图像分类?
- A4:不,它是专门为LLM环境中的多模态内容安全而设计和优化的,并非旨在用作独立的纯文本或纯图像分类器。
- Q5:如何访问 Llama Guard 3 11B Vision API?
- A5:该模型已在AI/ML API平台上线,标识符为“Llama-Guard-3-11B-Vision-Turbo”。您可以在平台的官方网站上找到访问权限和详细文档。



登录