qwen-bg
max-ico04
256K
出去
max-ico02
聊天
max-ico03
禁用
Qwen3-Next-80B-A3B 思考
它支持多标记预测和大上下文窗口(最多 100 万个标记),从而实现高效的实时推理和交互式应用。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'alibaba/qwen3-next-80b-a3b-thinking',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="alibaba/qwen3-next-80b-a3b-thinking",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
qwenmax-bg
图片
Qwen3-Next-80B-A3B 思考

产品详情

✨ 隆重推出 Qwen3-Next-80B-A3B 思维:您的高级推理人工智能

概述

Qwen3-Next-80B-A3B 思考 该模型是一款卓越的推理型聊天人工智能,专为解决复杂的多步骤问题和处理高级思维链任务而设计。它能够原生生成结构化的“思考”轨迹,使其在需要深度分析推理的领域表现异常出色,例如复杂的数学证明、稳健的代码合成、逻辑演绎和复杂的智能体规划。

💡 技术规格

Qwen3-Next-80B-A3B 思维是一种先进的语言模型,其特点是 800亿个参数一项关键创新是其稀疏的混合专家(MoE)架构,该架构确保只有 每个Tokens有 30 亿个参数处于活跃状态。这种设计能够显著提高效率。

  • ⚙️ 建筑学: 48 层,2048 个隐藏维度,采用混合设计,具有门控机制和高级归一化(RMSNorm)。
  • 📖 上下文窗口: 支持广泛的 262K Tokens可扩展至 100万个Tokens 采用专门的扩展方法,以实现对长期上下文的更深入理解。
  • 效率: 它采用资源高效的混合策略进行训练,在复杂推理、数学、编码和多步骤问题解决方面表现出色,同时保持较低的推理成本和较高的吞吐量。

📈 性能基准测试

MMLU(常识)

78.5%

HumanEval(代码生成)

82.1%

GSM8K(数学)

91.2%

MT-Bench(操作说明如下)

84.3%

💰 API 定价

输入:

0.1575美元

输出:

1.6美元

🚀 主要特点

  • 🧠 思维模式优化: 专为思维导图和复杂问题解决而设计,可生成更长、更详细的输出轨迹,从而提高透明度。
  • 稀疏激活: 每个令牌仅激活 800 亿个参数中的 30 亿个,从而实现快速推理和显著的成本效益。
  • 多词预测: 通过同时预测多个标记来加速解码过程,从而提高输出速度。
  • 🔗 稳定的长篇推理: 专为在长时间推理链和复杂指令中保持稳定而设计。
  • 🤖 代理集成: 完全支持函数调用,并可无缝集成到需要逐步分析解决方案的代理框架中。
  • 🌐 多语言和多模态: 具备强大的多语言理解能力,并支持跨多种语言和模式的国际多样化推理任务。

🎯 使用案例

  • 🔬 科学研究: 非常适合进行深度假设生成和复杂数据分析。
  • 💻 工程与数学: 擅长解决问题、证明以及复杂的代码合成/调试。
  • ⚖️ 法律分析: 支持详细的法律案例分析和结构化的论证构建。
  • 📊 金融与商业: 通过透明的决策步骤,辅助进行财务风险建模和战略业务规划。
  • ⚕️ 医疗诊断协助: 提供清晰的推理过程和详细的解释,以支持诊断。
  • 📄 长语境文档分析: 非常适合需要深度上下文信息的文档分析和检索增强型工作流程。

代码示例

下图展示了如何通过 API(例如,兼容 OpenAI 的聊天自动完成功能)与 Qwen3-Next-80B-A3B 思维模型进行交互。实际实现细节可能因环境而异。

 

↔️ 与其他领先型号的比较

对比 Qwen3-32B

Qwen3-Next-80B-A3B 仅激活 每个Tokens 30 亿个参数这与 Qwen3-32B 的完全激活形成对比。这使得 Qwen3-Next 大约 效率提高 10 倍 无论在训练成本还是推理成本方面,它都能提供超过 输出速度提高10倍 在长上下文场景(超过 32K 个令牌)中,同时在推理和复杂任务中取得卓越的准确率。

对比 Qwen3-235B

尽管Qwen3-Next-80B-A3B的有效参数数量显著少于Qwen3-235B(后者拥有2350亿个参数),但其性能却非常接近后者,尤其是在指令跟踪和长上下文推理方面。它在性能和逻辑推理之间取得了极佳的平衡。 计算效率和高模型质量因此,它非常适合生产环境。

对比 Google Gemini-2.5-Flash-Thinking

Qwen3-Next-80B-A3B Thinking 版本在关键领域明显优于 Google Gemini-2.5-Flash-Thinking,例如 逻辑推理多轮指令任务凭借其稀疏激活和多令牌预测功能,该技术性能卓越,运营成本却大幅降低。

与 Llama 3.1-70B 的比赛

Qwen3-Next-80B-A3B 提供增强功能 长远背景理解 在更大的上下文窗口下具有更优异的推理稳定性(可扩展至 100万个Tokens显著超越了 Llama 3.1-70B 的原生窗口限制。其稀疏的 MoE 架构也使其在规模化应用中拥有卓越的效率。

❓ 常见问题解答 (FAQ)

Q1:Qwen3-Next-80B-A3B Thinking 在推理任务方面有何独特之处?

A1:它专为复杂的多步骤问题解决和思维链优化而设计,采用“思考模式”,默认生成结构化推理轨迹。其稀疏的MoE架构也确保了效率,同时又不影响深度分析能力。

Q2:稀疏的 MoE 架构如何使该模型受益?

A2:稀疏混合专家(MoE)架构意味着每个词元只有 30 亿个参数处于激活状态(占其 800 亿个参数的 30 亿个)。这显著降低了推理成本,提高了处理速度,并保持了高吞吐量,尤其是在处理复杂的推理任务时。

Q3:Qwen3-Next-80B-A3B Thinking 支持的最大上下文窗口是多少?

A3:该模型原生支持 262K 个标记的广泛上下文窗口,并且通过专门的扩展方法,可以扩展到惊人的 100 万个标记,从而实现卓越的长上下文理解。

Q4:Qwen3-Next-80B-A3B 思维能否集成到代理系统中?

A4:是的,它完全支持函数调用,并且设计用于无缝集成到需要精确的、逐步分析解决方案的代理框架中。

Q5:它的性能与其他大型语言模型(如 Llama 3.1-70B)相比如何?

A5:与 Llama 3.1-70B 相比,Qwen3-Next-80B-A3B Thinking 在更大的上下文窗口(高达 100 万个 token)内提供更好的长期上下文理解和推理稳定性。其稀疏的 MoE 架构也提供了更高效的规模化性能。

API 操练场(Playground)

集成前,请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。
免费试用
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用