



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'google/gemma-3n-e4b-it',
messages: [
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="google/gemma-3n-e4b-it",
messages=[
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Detalle del producto
Gemma 3n 4B es el innovador modelo de IA multimodal de Google, enfocado en dispositivos móviles. Diseñado específicamente para una implementación eficiente en dispositivos, ofrece capacidades de IA de nivel empresarial directamente a smartphones y tablets. Al aprovechar su tecnología de vanguardia... Arquitectura MatFormer y Almacenamiento en caché de PLEGemma 3n 4B ofrece un rendimiento potente con un consumo de recursos notablemente mínimo.
⚙️ Especificaciones técnicas
Puntos de referencia de rendimiento
Gemma 3n 4B está meticulosamente optimizado para la implementación móvil y cuenta con capacidades avanzadas de procesamiento multimodal:
- Ventana de contexto: 8K tokens
- Capacidad de salida: Hasta 2K tokens por respuesta
- Huella de memoria: Mantiene un funcionamiento dinámico de 2 GB a 3 GB, impresionante por su recuento de parámetros de 5 B a 8 B.
- Velocidad de procesamiento: 1,5 veces más rápido que su predecesor, Gemma 3 4B, en dispositivos móviles
Precios de la API
GRATIS
🚀 Métricas de rendimiento
Según las puntuaciones competitivas Elo de Chatbot Arena, Gemma 3n demuestra un rendimiento excepcional con una puntuación de 1283Esto lo coloca en una notable segunda posición, muy cerca del Soneto Claude 3.7 (1287). Este logro es particularmente notable dado que Gemma 3n alcanza un rendimiento tan alto con solo 4B de parámetros en memoria.

💡 Capacidades clave
Gemma 3n 4B está diseñado para ofrecer un procesamiento de IA multimodal altamente eficiente, especialmente en entornos con recursos limitados:
- Arquitectura MatFormer: Emplea activación selectiva de parámetros, reduciendo significativamente los costos de cálculo y mejorando los tiempos de respuesta.
- Almacenamiento en caché PLE (incrustación por capa): Optimiza el uso de la memoria al descargar estratégicamente parámetros al almacenamiento rápido.
- Carga de parámetros condicionales: Carga dinámicamente solo los parámetros necesarios (texto, visuales o audio), mejorando aún más la optimización de la memoria.
- Soporte multilingüe: Entrenado en más de 140 idiomas, lo que permite una implementación global versátil.
- Diseño que prioriza la privacidad: Funciona completamente sin conexión, lo que garantiza una mayor privacidad y seguridad de los datos sin necesidad de conexión a Internet.
🎯 Casos de uso óptimos
- Aplicaciones móviles: Potencia funciones de inteligencia artificial avanzadas en teléfonos inteligentes y tabletas, incluso con RAM limitada.
- Computación de borde: Facilita el procesamiento de IA en tiempo real directamente en dispositivos IoT y sistemas integrados.
- Soluciones de IA sin conexión: Ideal para aplicaciones centradas en la privacidad que requieren un procesamiento local sólido.
💻 Ejemplos de código
Explore ejemplos de código prácticos para integrar Gemma 3n 4B en sus proyectos de desarrollo:
⚖️ Comparación con otros modelos
- Contra Gemma 3 4B: Entrega Velocidad de procesamiento un 50% más rápida, junto con una calidad de salida superior y un consumo de memoria reducido.
- Comparación con los modelos estándar 5B-8B: Funciona con una huella de memoria efectiva de 2B a 4B (2-3 GB de RAM), significativamente menos que los requisitos típicos de 6 a 16 GB de modelos comparables.
- Contra Qwen 3 4B: Muestra un rendimiento superior en tareas de clasificación y extracción de JSON estructurado, aunque los resultados pueden variar en aplicaciones de codificación y RAG.
🚫 Limitaciones
Si bien es potente, Gemma 3n 4B tiene ciertas limitaciones:
- Sin capacidades de visión integradas.
- Carece de soporte para ajuste fino.
- Limitado principalmente a tareas basadas en texto.
🔗 Integración API
Gemma 3n 4B es totalmente accesible a través de la API de IA/ML. Para consultar la documentación completa y las guías de integración, haga clic aquí: Disponible aquí.
❓ Preguntas frecuentes (FAQ)
1. ¿Cuál es el propósito principal de Gemma 3n 4B?
Gemma 3n 4B está diseñado como un modelo de IA multimodal y móvil, optimizado para brindar capacidades de IA de nivel empresarial a teléfonos inteligentes y tabletas con alta eficiencia y un consumo mínimo de recursos.
2. ¿Cómo logra Gemma 3n 4B su alta eficiencia y bajo consumo de memoria?
Aprovecha la innovadora arquitectura MatFormer para la activación selectiva de parámetros, el almacenamiento en caché de incrustación por capa (PLE) para descargar parámetros y la carga de parámetros condicional para cargar dinámicamente solo los componentes necesarios, todo lo cual contribuye a su eficiencia superior.
3. ¿Puede Gemma 3n 4B funcionar sin conexión a Internet?
Sí, Gemma 3n 4B cuenta con un diseño que prioriza la privacidad, lo que le permite funcionar completamente sin conexión. Esto lo hace ideal para aplicaciones que priorizan la privacidad y escenarios de edge computing donde la conectividad a internet puede ser limitada.
4. ¿Cuáles son las limitaciones clave de Gemma 3n 4B?
Sus principales limitaciones incluyen la ausencia de capacidades de visión, la falta de soporte para ajustes finos por parte de los usuarios y sus operaciones se limitan principalmente a tareas basadas en texto.
5. ¿Cómo se compara Gemma 3n 4B con su predecesor, Gemma 3 4B?
Gemma 3n 4B supera significativamente a su predecesora, Gemma 3 4B, al ofrecer una velocidad de procesamiento un 50 % más rápida y al mismo tiempo mantener una calidad de salida superior y requerir menos memoria.
Patio de juegos de IA



Acceso