



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'nousresearch/hermes-4-405b',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="nousresearch/hermes-4-405b",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")
- API 操练场(Playground)

在集成之前,请在沙箱环境中测试所有 API 模型。
我们提供 300 多种模型供您集成到您的应用程序中。


产品详情
✨ 揭晓 Hermes 4 405B API:下一代混合推理
爱马仕 4 405B 它代表了一种尖端的混合推理语言模型,由……精心开发 我们研究建立在坚实的基础上 Meta 的 Llama-3.1-405B该型号是专门为……而设计的。 高级推理能力,生产 结构化输出并提供 灵活的用户控制它已成为高要求人工智能应用(例如在以下关键领域)的首选方案: 数学、编程、STEM(科学、技术、工程和数学)以及复杂的逻辑推理任务。
🧠 技术规格
- ✔️ 基础架构: 基于 Llama-3.1-405B 制造,该型号被公认为是目前最大的开放式变压器之一。
- ✔️ 参数数量: 它拥有惊人的 4050 亿个参数,可以进行复杂的计算。
- ✔️ 训练数据: 使用约 600 亿个高质量训练后数据的标记进行指令调整,重点在于开发稳健的推理轨迹。
🚀 性能基准测试
- 💡 数学与逻辑: 表现出卓越的性能,超越了以往的 Hermes 模型,并在复杂的数学、代码和逻辑推理任务中与领先的闭源模型直接竞争。
- 💡 STEM与创造力: 在科学、技术、工程和数学领域表现出色,同时在创意写作方面也展现出强大的能力,并能产出格式更规范的作品。
- 💡 总助理: 适用于各种通用任务,在多轮对话中表现出高度的连贯性和对上下文的理解能力。
- 💡 速度与深度: 其创新的混合推理模式使用户能够动态地在快速、直接的反应和更深刻、深思熟虑的处理之间进行选择,并带有明确的推理痕迹。
✨ 主要特点
- ⚙️ 混合推理模式: 用户可以使用指定的按钮轻松地在快速、直接的响应和详细的、基于追踪的推理过程之间切换。
推理布尔标志。 - 🎯 增强转向性能: 提供无与伦比的定制性,显著改善了用户指导任务的对齐情况并降低了拒绝率,从而确保更精确、更可控的输出。
- 📜 大上下文窗口: 经过精心设计,能够熟练处理大量文档并完成复杂的多步骤任务,始终保持卓越的连贯性和准确性。
💲 Hermes 4 405B API 定价
- ➡️ 输入: 每百万个Tokens1.05美元
- ⬅️ 输出: 每百万Tokens3.15美元
🎯 多种应用场景
- 🔢 高级推理: 非常适合解决数学、逻辑和 STEM 问题解决方面的复杂挑战。
- 💻 代码生成: 提供可靠的代码合成、高效的调试辅助和全面的技术文档功能。
- ✍️ 创意写作: 能够激发引人入胜的故事讲述、动态的角色扮演场景,并产生细致入微、主观的回应。
- 🏢 企业集成: 非常适合开发复杂的企业助手、智能聊天机器人,以及在组织结构内实现复杂工作流程的自动化。
>代码示例
⚖️ 与其他领先型号的比较
- ➡️ vs Llama-3.1 指令: Hermes 4 405B 提供 卓越的推理能力、结构化的输出和增强的可控性此外,更大的训练后语料库及其创新的混合推理模式也进一步增强了其性能。
- ➡️ 与 GPT-4.1 nano 对比: Hermes 4 405B 始终匹配或 在智能和推理基准测试中超越 GPT-4.1 nano同时,它还具有更大的上下文窗口和显著更低的拒绝率。
- ➡️ 对战 Hermes 3: Hermes 4 代表着一次重大进步,其特点是 训练数据集比之前的数据集大 50 倍此外,推理轨迹也得到了极大的改进,模式遵循性和函数调用能力也得到了增强。
- ➡️ 对战Claude 3: Hermes 4 405B 在数学、代码和结构化输出方面表现尤为出色,并始终高度重视…… 用户控制和中立性 在其回应中。
❓ 常见问题解答 (FAQ)
Q1:什么是 Hermes 4 405B?
Hermes 4 405B 是由 Nous Research 开发的最先进的混合推理语言模型。它基于 Meta 的 Llama-3.1-405B 基础架构,专为数学、代码、STEM 和逻辑推理等领域要求苛刻的 AI 应用而设计,可实现高级推理、结构化输出和灵活的用户控制。
Q2:Hermes 4 405B 的主要特点是什么?
主要功能包括:混合推理模式,可在快速响应和详细响应之间切换;增强的可控性,可自定义输出;以及能够处理大量文档和复杂多步骤任务的大型上下文窗口。
Q3:Hermes 4 405B 与其他型号相比如何?
Hermes 4 405B 相较于 Llama-3.1 Instruct 具有更出色的推理和可控性,在更大的上下文窗口下,其智能水平可与 GPT-4.1 nano 相媲美甚至超越后者,并且在训练数据集扩大 50 倍的情况下,性能较 Hermes 3 有了显著提升。此外,它在数学、代码和结构化输出方面也优于 Claude 3,并更加注重用户控制。
Q4:Hermes 4 405B 的主要应用场景是什么?
它的主要应用场景包括:数学、逻辑和 STEM 领域的高级推理;可靠的代码生成和调试;用于讲故事和角色扮演的创意写作;以及用于助手和工作流程自动化的强大企业集成。
Q5:Hermes 4 405B 的 API 定价是多少?
API 的定价为:输入每百万个Tokens 1.05 美元,输出每百万个Tokens 3.15 美元。



登录