32K

在

出去

聊天

禁用

Qwen 3 235B A22B

阿里云的Qwen 3融合了密集架构和MoE架构，可实现卓越的编码、多语言支持和跨119种语言的长上下文处理，从而为高效的企业解决方案提供支持。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'Qwen/Qwen3-235B-A22B-fp8-tput',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="Qwen/Qwen3-235B-A22B-fp8-tput",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

Qwen 3 235B A22B

产品详情

✨ 探索 Qwen3-235B-A22B：阿里云旗舰级 AI 模型

这 Qwen3-235B-A22B 由……开发的模型阿里云，作为首屈一指的大型语言模型 (LLM)，它采用了一种复杂的技术。混合专家（MoE）架构拥有令人印象深刻的总共2350亿个参数它能智能地激活每次推理涉及 220 亿个参数在关键领域取得了无与伦比的性能，例如编程、数学和复杂推理它的多功能性还体现在： 119种语言这使其成为全球企业应用的理想解决方案，涵盖从软件开发到高级研究的各个领域。通过 AI/ML API 可以简化访问流程。

🚀 技术深度解析：架构与性能

Qwen3-235B-A22B 采用尖端技术设计基于变压器的MoE架构它会动态选择排名前 8 的专家每个Tokens仅激活其总共 2350 亿个参数中的 220 亿个，从而在保持最佳性能的同时显著降低计算成本。增强功能旋转定位嵌入和群组查询注意力它确保了卓越的效率。该模型已在广泛的数据集上进行了预训练。 36万亿个Tokens 跨越 119种语言并通过 RLHF 和严格的四阶段后训练过程进一步完善，以获得更优异的混合推理能力。

上下文窗口：原生支持 32K Tokens可扩展至令人印象深刻的 128K Tokens 集成 YaRN。
关键基准：
- ✅ 性能优于 OpenAI 的 o3-mini 在 AIME（数学）和 Codeforces（编程）上。
- ✅ 超越 Gemini 2.5 Pro 在 BFCL（推理）和 LiveCodeBench 上。
- ✅ 达到 MMLU 得分 0.828直接与 DeepSeek R1 竞争。
绩效指标：实现快速 40.1 个令牌/秒的输出速度低延迟 0.54秒（TTFT - 首次令牌到达时间）。
API定价（极具竞争力）：
- 输入标记：每百万Tokens0.21美元
- 输出标记：每百万Tokens0.63美元
- 购买 1000 个Tokens的成本（投入 + 产出）：总计 0.00084 美元

性能对比：Qwen3-235B-A22B 与领先的LLM

💡 关键能力：赋能多样化应用

Qwen3-235B-A22B 在以下方面表现卓越混合推理熟练地在详细的思考模式（/think）用于逐步解决问题和快速无思考模式（/no_think）为了快速响应。它原生支持 119种语言确保多语言聊天机器人和高级翻译等应用在全球范围内无缝部署。凭借其强大的功能， 128K 令牌上下文窗口它能够高效地处理海量数据集、复杂的代码库和大量的文档，通过使用 XML 分隔符来保持结构一致性，从而保持高度的连贯性。

>卓越的编码能力：在 LiveCodeBench 测试中，其性能优于 OpenAI 的 o1，支持超过 40 种编程语言（例如，Python、Java、Haskell）。它能够以极高的精度生成、调试和重构复杂的代码库。
🧠 高级推理：在 AIME 数学测试中超越 o3-mini，在 BFCL 逻辑推理测试中超越 o3-mini，使其成为需要深度分析能力的复杂问题解决场景的理想选择。
🌍 多语言能力：原生处理 119种语言为语义分析、内容本地化和高级翻译服务等关键跨语言任务提供支持。
🏢 企业应用：满足各种企业需求的催化剂，包括生物医学文献解析、复杂的金融风险建模、精确的电子商务意图预测和详细的法律文件分析。
🤖 智能体工作流程：支持高级功能，例如工具调用，这模型上下文协议（MCP）以及函数调用，从而能够创建自主且高效的人工智能代理。
⚙️ API 功能：提供强大的 API 功能，包括流输出， OpenAI API 兼容性并生成结构化输出，以便与现有系统无缝实时集成。

🎯 最佳应用场景：Qwen3-235B-A22B 的优势所在

Qwen3-235B-A22B 专为需要深度推理、可扩展性和多语言支持的复杂企业环境而设计。

软件开发：利用其在 Codeforces 和 LiveCodeBench 上的卓越性能，为大型项目提供自主代码生成、高级调试和智能重构功能。
生物医学研究：准确解析晦涩难懂的医学文献，构建复杂的临床笔记，并生成高度逼真的患者对话。
财务建模：进行复杂的风险分析，高效回答监管机构的问询，并运用精确的数字推理总结财务文件。
多语言电子商务：推动智能语义产品分类、精准用户意图预测，并部署高效的多语言聊天机器人 119种语言。
法律分析：利用以下方式促进对监管合规性和高级法律研究的全面多文档审查： 128K-token 上下文无与伦比的连贯性。

🆚 比较优势：Qwen3-235B-A22B 相对于竞争对手

Qwen3-235B-A22B凭借其高效的MoE架构和卓越的多语言能力，在领先的LLM中脱颖而出。

与 OpenAI 的 o3-mini 相比：表现优于在数学（AIME）和编程（Codeforces）方面，延迟更低（TTFT 为 0.54 秒，而其他设备为 0.7 秒）。提供显著优势。更广泛的语言支持（119 种语言对比约 20 种语言）。
与Google Gemini 2.5 Pro 相比：卓越在推理（BFCL）和编码（LiveCodeBench）方面，使用更大的上下文窗口（128K Tokens vs. 96K Tokens）并通过其 MoE 设计实现更高效的推理。
与 DeepSeek R1 对比：与 MMLU 性能 (0.828) 相符但超越在多语言任务和企业级可扩展性方面，同时提供更优惠的 API 定价。
与 GPT-4.1 相比：竞争的在核心编码和推理基准测试中，展现出明显的优势。降低运营成本和本地人支持119种语言这与 GPT-4.1 主要关注英语形成了鲜明对比。

💻 代码示例：集成 Qwen3-235B-A22B

以下示例展示了如何通过 API 与 Qwen3-235B-A22B 模型进行交互，以完成聊天任务：

 import openai client = openai.OpenAI( base_url="https://api.aliyun.com/v1/qwen3/", # 示例 API 端点 api_key="YOUR_ALIYUN_API_KEY", ) response = client.chat.completions.create( model="Qwen/Qwen3-235B-A22B-fp8-tput", messages=[ {"role": "system", "content": "您是一位乐于助人的 AI 助手。"}, {"role": "user", "content": "/think 法国的首都是什么？请提供详细的解释。"}, ], temperature=0.7, max_tokens=200, ) print(response.choices[0].message.content)

⚠️ 重要局限性

精度下降：当上下文超出预期范围时，模型准确性可能会下降。 10万Tokens。
思维模式延迟：利用 “/think”模式会增加响应延迟；使用 "/no_think" 为了更快地输出结果。
访问限制： Qwen3-235B-A22B 是未公开访问权限仅通过以下方式授予阿里云模型工作室。
许可限制： Qwen 许可证通常限制商业用途，因此主要用于研究型。

🔗 API 集成详情

通过其全面的AI/ML API，集成Qwen3-235B-A22B非常简单。有关详细的技术文档和API参考，请访问阿里云官方资源。

文档链接：阿里云 Qwen3-235B-A22B API 参考

❓ 常见问题解答 (FAQ)

问：Qwen3-235B-A22B 的 MoE 架构的主要优势是什么？

答：混合专家（MoE）架构允许模型在每次推理中仅激活其 2350 亿个参数中的 220 亿个，从而显著降低计算成本，同时在各种任务中保持一流的性能。
问：Qwen3-235B-A22B 支持多少种语言？

答：它原生支持 119 种语言，因此非常适用于聊天机器人、翻译和全球内容分析等多语言应用。
问：该模型的最大上下文窗口是多少？

答：虽然它本身提供 32K 个 token 的上下文窗口，但通过 YaRN 可以扩展到惊人的 128K 个 token，从而能够处理非常大的文档和代码库。
问：Qwen3-235B-A22B 是否可供公众使用？

答：不，它不对外公开。访问权限仅通过阿里云模型工作室提供，其许可主要用于研究用途。
问：与其他模式相比，它的 API 定价如何？

答：Qwen3-235B-A22B 提供极具竞争力的 API 定价，输入Tokens每百万个 0.21 美元，输出Tokens每百万个 0.63 美元，1,000 个Tokens（输入+输出）的总成本为 0.00084 美元。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

一个 API
300多个人工智能模型

节省20%的费用