qwen-bg
max-ico04
128 mil
Em
Fora
max-ico02
Bater papo
max-ico03
desativar
GLM-4.5 Ar
Ao oferecer desempenho próximo ao de modelos topo de linha com uma redução significativa no número de parâmetros ativos e nos requisitos de memória, permite que as organizações implementem funcionalidades avançadas de modelos de linguagem de grande porte sem a necessidade de uma infraestrutura computacional extensa.
Tokens de $1 grátis para novos membros
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'zhipu/glm-4.5-air',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="zhipu/glm-4.5-air",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

Uma API com mais de 300 modelos de IA

Economize 20% nos custos e ganhe tokens grátis de $1.
qwenmax-bg
imagem
GLM-4.5 Ar

Detalhes do produto

GLM-4.5-Air da Zhipu AI destaca-se como um altamente eficiente e custo-benefício Modelo de linguagem amplo. Projetado com um design avançado de Mistura de Especialistas (MoE), ele possui 106 bilhões de parâmetros no total (com 12 bilhões ativos). Perfeitamente adequado para uma ampla gama de aplicações de texto para texto, ele espelha o impressionante modelo GLM-4.5 completo. Janela de contexto com 128.000 tokensEssa capacidade permite que ele compreenda e gere textos excepcionalmente longos, reduzindo drasticamente a sobrecarga computacional.

Especificações técnicas

🚀 Indicadores de desempenho

  • Janela de contexto: 128.000 tokens
  • Classificado 6º lugar geral Em 12 indicadores de referência do setor, alcançou uma pontuação média de 59,8.
  • Capacidade de raciocínio: Resultados impressionantes em MMLU-Pro (81,4%), AIME24 (89,4%) e Matemática (98,1%), além de sólidas habilidades de programação.

📊 Métricas de desempenho para aplicações com agentes

O GLM-4.5-Air foi desenvolvido especificamente para aplicações agentivas, apresentando uma robusta janela de contexto de 128.000 tokens e recursos integrados de execução de funções. Em benchmarks agentivos líderes, como τ-bench e BFCL-v3, ele alcança resultados quase equivalentes a Soneto 4 de ClaudeNotavelmente, em testes especializados de navegação na web (BrowseComp), que avaliam o raciocínio complexo em várias etapas e o uso de ferramentas, o GLM-4.5-Air demonstra uma Taxa de precisão de 26,4%Isso supera o Claude-4-Opus (18,8%) e se aproxima bastante do o4-mini-high, de nível superior, com 28,3%. Esses números destacam o desempenho equilibrado e robusto do GLM-4.5-Air em tarefas reais, orientadas por ferramentas e em cenários com agentes.

Gráfico de desempenho GLM-4.5-Air

💡 Principais capacidades

  • Geração de texto avançada: Produz textos fluentes e contextualmente precisos, adequados para conteúdo extenso e diálogos complexos com múltiplas interações.
  • Raciocínio Agencial Eficiente: Mantém sólidas habilidades de codificação, raciocínio e uso de ferramentas tanto no modo "pensamento" (resolução de problemas complexos) quanto no modo "não pensamento" (resposta instantânea).
  • Eficiência de recursos: Requer significativamente menos memória de GPU (implantável em GPUs de 16 GB), tornando-se uma excelente escolha para ambientes reais com recursos de hardware limitados.
  • Altamente competitivo para desenvolvimento prático e tarefas de agentes, oferecendo sugestões de código rápidas e análise detalhada de documentos.

💲 Preços da API

  • Entrada: $ 0,21
  • Saída: $ 1,155

Casos de uso ideais

  • Inteligência Artificial Conversacional com Custo-Benefício: Ideal para chatbots e assistentes virtuais de alto volume e baixa latência.
  • Assistência de codificação simplificada: Oferece preenchimento automático de código em tempo real, depuração e geração eficiente de documentação.
  • Análise de Documentos Complexos: Capaz de analisar textos jurídicos, científicos e comerciais em grande escala.
  • Implantações móveis e de borda: Excelente desempenho em ambientes com recursos de hardware limitados.
  • Ferramentas Agónicas: Fornece suporte a agentes que utilizam ferramentas, recursos de navegação na web e transformação de conteúdo em lote.

Exemplo de código

Comparação com outros modelos

Contra Soneto 4 de Claude: O GLM-4.5-Air oferece um equilíbrio competitivo entre eficiência e desempenho, embora fique ligeiramente atrás do Claude 4 Sonnet em certas tarefas de codificação e raciocínio agentivo. Enquanto o Claude 4 Sonnet suporta uma janela de contexto maior (200 mil tokens contra 128 mil) e inclui recursos de entrada de imagem (tornando-o mais adequado para aplicações multimodais), o GLM-4.5-Air se destaca por ser de código aberto, mais econômico e que oferece alta confiabilidade em chamadas de função e raciocínio de múltiplas etapas..

Em comparação com GLM-4.5: O GLM-4.5-Air atinge aproximadamente 80-98% do desempenho do modelo principal GLM-4.5, mas com um número significativamente menor de parâmetros ativos (12 bilhões em vez de 32 bilhões) e requisitos de recursos reduzidos. Embora possa apresentar uma ligeira desvantagem em termos de precisão bruta da tarefa, ele mantém sólidas capacidades de raciocínio, codificação e atuação, tornando-o mais adequado para implantação em ambientes com recursos de hardware limitados.

Contra Qwen3-Coder: O GLM-4.5-Air compete eficazmente com o Qwen3-Coder em termos de codificação e utilização de ferramentas, proporcionando geração de código rápida e precisa para tarefas de programação complexas. O GLM-4.5-Air demonstra taxas de sucesso dominantes e mecanismos confiáveis ​​de chamada de ferramentas sobre o Qwen3-Coder.

Contra Gemini 2.5 Pro: O GLM-4.5-Air se sai bem em testes práticos de raciocínio e codificação, comparando-o com o Gemini 2.5 Pro. Embora o Gemini possa apresentar uma ligeira vantagem em alguns testes específicos de codificação e raciocínio, o GLM-4.5-Air oferece uma experiência mais completa. Equilíbrio favorável entre uma ampla janela de contexto e ferramentas de análise de agentes, otimizado para implantações eficientes no mundo real..

Limitações

  • Desempenho geral ligeiramente reduzido e menor número de parâmetros ativos em comparação com o modelo principal GLM-4.5.
  • Algumas tarefas complexas podem apresentar pequenas quedas de desempenho, embora as funcionalidades principais de texto e código permaneçam robustas.
  • Não é o ideal para organizações que priorizam a precisão de última geração acima de todas as outras considerações.
  • A utilização ideal de todo o seu contexto e recursos de suporte de ferramentas pode exigir uma nova infraestrutura para maior eficiência.

Perguntas frequentes (FAQ)

❓ Qual é a principal vantagem do GLM-4.5-Air da Zhipu AI?

✔️ A principal vantagem do GLM-4.5-Air reside em sua excepcional capacidade de manobra. eficiência e relação custo-benefício, alcançado por meio de um design de Mistura de Especialistas (MoE) com 12 bilhões de parâmetros ativos, tornando-o altamente eficiente em termos de recursos.

❓ Qual é o tamanho da janela de contexto do GLM-4.5-Air?

✔️ Apresenta uma substancial Janela de contexto com 128.000 tokens, permitindo a compreensão e geração de textos muito longos e complexos.

❓ Em quais áreas o GLM-4.5-Air apresenta forte desempenho competitivo?

✔️ Destaca-se em aplicações agentivas, navegação na web (superando o Claude-4-Opus)e oferece um desempenho sólido em codificação, raciocínio e uso de ferramentas, especialmente em ambientes com recursos de hardware limitados.

❓ Quais são os casos de uso ideais para o GLM-4.5-Air?

✔️ Os casos de uso ideais incluem IA conversacional com excelente custo-benefício, assistência de codificação simplificada, análise complexa de documentos e implantações em dispositivos móveis e de borda..

❓ Quais são as principais limitações do GLM-4.5-Air?

✔️ Suas principais limitações incluem um desempenho geral ligeiramente inferior em comparação com o modelo principal GLM-4.5, tornando-o menos adequado para cenários que exigem maior capacidade de processamento. Precisão absoluta de última geração acima de tudo.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.
Experimente grátis
api-right-1
modelo-bg02-1

Uma API
Mais de 300 modelos de IA

Economize 20% nos custos