



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'google/gemma-3n-e4b-it',
messages: [
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="google/gemma-3n-e4b-it",
messages=[
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Detalhes do produto
Gemma 3n 4B é o modelo de IA inovador, com foco em dispositivos móveis e multimodal do Google. Projetado especificamente para uma implementação eficiente em dispositivos, ele leva recursos de IA de nível empresarial diretamente para smartphones e tablets. Ao aproveitar sua tecnologia de ponta Arquitetura MatFormer e Cache PLEGemma 3n 4B oferece desempenho poderoso com consumo de recursos notavelmente mínimo.
⚙️ Especificações Técnicas
Indicadores de desempenho
Gemma 3n 4B foi meticulosamente otimizado para implantação móvel, apresentando recursos avançados de processamento multimodal:
- Janela de contexto: 8 mil tokens
- Capacidade de produção: Até 2 mil tokens por resposta.
- Pegada de memória: Mantém uma operação dinâmica de 2 GB a 3 GB, impressionante para sua contagem de parâmetros de 5 B a 8 B.
- Velocidade de processamento: 1,5 vezes mais rápido do que seu antecessor, Gemma 3 4B, em dispositivos móveis
Preços da API
LIVRE
🚀 Métricas de desempenho
Com base nas pontuações Elo da Chatbot Arena, Gemma 3n demonstra um desempenho excepcional com uma pontuação de 1283Isso a coloca em uma notável segunda posição, logo atrás de Claude 3.7 Sonnet (1287). Essa conquista é particularmente notável, visto que Gemma 3n atinge um desempenho tão alto com apenas 4B parâmetros na memória.

💡 Principais capacidades
Gemma 3n 4B foi projetado para oferecer processamento de IA multimodal altamente eficiente, especialmente em ambientes com recursos limitados:
- Arquitetura MatFormer: Utiliza ativação seletiva de parâmetros, reduzindo significativamente os custos computacionais e melhorando os tempos de resposta.
- Cache PLE (Incorporação por Camada): Otimiza o uso da memória, descarregando estrategicamente parâmetros para armazenamento rápido.
- Carregamento condicional de parâmetros: Carrega dinamicamente apenas os parâmetros necessários (texto, visual ou áudio), otimizando ainda mais o uso da memória.
- Suporte multilíngue: Treinado em mais de 140 idiomas, possibilitando uma implantação global versátil.
- Design com foco na privacidade: Funciona completamente offline, garantindo maior privacidade e segurança de dados sem necessidade de conexão com a internet.
🎯 Casos de uso ideais
- Aplicativos móveis: Potencializa recursos avançados de IA em smartphones e tablets, mesmo com memória RAM limitada.
- Computação de borda: Facilita o processamento de IA em tempo real diretamente em dispositivos IoT e sistemas embarcados.
- Soluções de IA offline: Ideal para aplicações focadas em privacidade que exigem processamento local robusto.
💻 Exemplos de código
Explore exemplos práticos de código para integrar o Gemma 3n 4B em seus projetos de desenvolvimento:
⚖️ Comparação com outros modelos
- Contra Gemma 3 4B: Entrega Velocidade de processamento 50% mais rápida, aliado a uma qualidade de saída superior e menor consumo de memória.
- Em comparação com os modelos padrão 5B-8B: Opera com uma pegada de memória efetiva de 2B a 4B (2 a 3 GB de RAM), significativamente menor do que os requisitos típicos de 6 a 16 GB de modelos comparáveis.
- Contra Qwen 3 4B: Apresenta desempenho superior em tarefas de classificação e extração de JSON estruturado, embora os resultados possam variar em aplicações de codificação e RAG.
🚫 Limitações
Embora potente, Gemma 3n 4B apresenta algumas limitações:
- Sem recursos de visão integrados.
- Não oferece suporte para ajustes finos.
- Principalmente limitado a tarefas baseadas em texto.
🔗 Integração de API
Gemma 3n 4B é totalmente acessível através da API de IA/ML. Para obter documentação completa e guias de integração, clique aqui: Disponível aqui.
❓ Perguntas frequentes (FAQ)
1. Qual é o objetivo principal de Gemma 3n 4B?
Gemma 3n 4B foi projetado como um modelo de IA multimodal com foco em dispositivos móveis, otimizado para levar recursos de IA de nível empresarial para smartphones e tablets com alta eficiência e consumo mínimo de recursos.
2. Como o Gemma 3n 4B consegue atingir sua alta eficiência e baixa ocupação de memória?
Ele utiliza a arquitetura inovadora MatFormer para ativação seletiva de parâmetros, cache de incorporação por camada (PLE) para descarregar parâmetros e carregamento condicional de parâmetros para carregar dinamicamente apenas os componentes necessários, contribuindo para sua eficiência superior.
3. O Gemma 3n 4B pode funcionar sem conexão com a internet?
Sim, o Gemma 3n 4B apresenta um design que prioriza a privacidade, permitindo que ele funcione completamente offline. Isso o torna ideal para aplicações que exigem privacidade e cenários de computação de borda onde a conectividade com a internet pode ser limitada.
4. Quais são as principais limitações do Gemma 3n 4B?
Suas principais limitações incluem a ausência de recursos de visão computacional, a falta de suporte para ajustes finos por parte dos usuários e o fato de suas operações serem restritas principalmente a tarefas baseadas em texto.
5. Como o Gemma 3n 4B se compara ao seu antecessor, o Gemma 3 4B?
A Gemma 3n 4B supera significativamente sua antecessora, a Gemma 3 4B, oferecendo uma velocidade de processamento 50% maior, mantendo simultaneamente uma qualidade de saída superior e exigindo menos memória.
Playground de IA



Conecte-se