



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'google/gemma-3n-e4b-it',
messages: [
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="google/gemma-3n-e4b-it",
messages=[
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Détails du produit
Gemma 3n 4B est le modèle d'IA innovant, mobile et multimodal de Google. Spécialement conçu pour un déploiement efficace sur les appareils, il apporte des capacités d'IA de niveau entreprise directement sur les smartphones et les tablettes. En tirant parti de sa technologie de pointe Architecture MatFormer et Mise en cache PLELa Gemma 3n 4B offre des performances exceptionnelles avec une consommation de ressources remarquablement minimale.
⚙️ Spécifications techniques
Indicateurs de performance
La Gemma 3n 4B est méticuleusement optimisée pour le déploiement mobile, avec des capacités de traitement multimodal avancées :
- Fenêtre contextuelle : 8K jetons
- Capacité de production : Jusqu'à 2 000 jetons par réponse
- Empreinte mémorielle : Maintient un fonctionnement dynamique de 2 à 3 Go, impressionnant compte tenu de son nombre de paramètres de 5 à 8 milliards.
- Vitesse de traitement : 1,5 fois plus rapide que son prédécesseur, Gemma 3 4B, sur les appareils mobiles
Tarification de l'API
GRATUIT
🚀 Indicateurs de performance
D'après les scores Elo de Chatbot Arena, Gemma 3n affiche des performances exceptionnelles avec un score de 1283Cela la place à une remarquable deuxième place, juste derrière Claude 3.7 Sonnet (1287). Cette performance est d'autant plus remarquable que Gemma 3n atteint un tel niveau de performance avec seulement 4 milliards de paramètres en mémoire.

💡 Fonctionnalités clés
Gemma 3n 4B est conçue pour fournir un traitement d'IA multimodale très efficace, notamment dans les environnements aux ressources limitées :
- Architecture MatFormer : Utilise l'activation sélective des paramètres, réduisant considérablement les coûts de calcul et améliorant les temps de réponse.
- Mise en cache PLE (intégration par couche) : Optimise l'utilisation de la mémoire en déchargeant stratégiquement les paramètres vers un stockage rapide.
- Chargement conditionnel des paramètres : Charge dynamiquement uniquement les paramètres nécessaires (texte, visuel ou audio), optimisant ainsi davantage la mémoire.
- Assistance multilingue : Entraîné sur 140 langues, permettant un déploiement mondial polyvalent.
- Conception axée sur la confidentialité : Fonctionne entièrement hors ligne, garantissant une confidentialité et une sécurité des données renforcées sans nécessiter de connexion Internet.
🎯 Cas d'utilisation optimaux
- Applications mobiles : Permet d'exploiter des fonctionnalités d'IA avancées sur les smartphones et les tablettes, même avec une RAM limitée.
- Informatique de périphérie : Facilite le traitement de l'IA en temps réel directement sur les appareils IoT et les systèmes embarqués.
- Solutions d'IA hors ligne : Idéal pour les applications axées sur la confidentialité qui nécessitent un traitement local robuste.
💻 Exemples de code
Explorez des exemples de code pratiques pour intégrer Gemma 3n 4B dans vos projets de développement :
⚖️ Comparaison avec d'autres modèles
- Contre Gemma 3 4B : Livraison Vitesse de traitement 50 % plus rapide, associée à une qualité de sortie supérieure et à une empreinte mémoire réduite.
- Par rapport aux modèles standard 5B-8B : Fonctionne avec une empreinte mémoire effective de 2 à 4 Go (2 à 3 Go de RAM), nettement inférieure aux exigences typiques de 6 à 16 Go des modèles comparables.
- Contre Qwen 3 4B : Il présente des performances supérieures dans les tâches de classification et l'extraction JSON structurée, bien que les résultats puissent varier dans les applications de codage et RAG.
🚫 Limitations
Bien que performante, la Gemma 3n 4B présente certaines limitations :
- Aucune capacité de vision intégrée.
- Ne propose pas de fonctionnalités de réglage fin.
- Principalement limité aux tâches textuelles.
🔗 Intégration API
Gemma 3n 4B est entièrement accessible via l'API IA/ML. Pour une documentation complète et des guides d'intégration, veuillez cliquer ici : Disponible ici.
❓ Foire aux questions (FAQ)
1. Quel est l'objectif principal de Gemma 3n 4B ?
Gemma 3n 4B est conçu comme un modèle d'IA multimodal et mobile-first, optimisé pour apporter des capacités d'IA de niveau entreprise aux smartphones et tablettes avec une efficacité élevée et une consommation de ressources minimale.
2. Comment Gemma 3n 4B parvient-elle à une efficacité élevée et à une faible empreinte mémoire ?
Elle tire parti de l'architecture innovante MatFormer pour l'activation sélective des paramètres, de la mise en cache Per-Layer Embedding (PLE) pour décharger les paramètres et du chargement conditionnel des paramètres pour charger dynamiquement uniquement les composants nécessaires, contribuant ainsi à son efficacité supérieure.
3. La Gemma 3n 4B peut-elle fonctionner sans connexion internet ?
Oui, la Gemma 3n 4B est conçue pour protéger la vie privée, ce qui lui permet de fonctionner entièrement hors ligne. Elle est donc idéale pour les applications sensibles à la confidentialité et les scénarios d'informatique de périphérie où la connectivité Internet peut être limitée.
4. Quelles sont les principales limitations de Gemma 3n 4B ?
Ses principales limitations incluent l'absence de capacités de vision, l'absence de prise en charge du réglage fin par les utilisateurs et le fait que ses opérations se limitent principalement aux tâches textuelles.
5. En quoi Gemma 3n 4B se compare-t-elle à son prédécesseur, Gemma 3 4B ?
La Gemma 3n 4B surpasse nettement son prédécesseur, la Gemma 3 4B, en offrant une vitesse de traitement 50 % plus rapide tout en maintenant une qualité de sortie supérieure et en nécessitant moins de mémoire.
Terrain de jeu de l'IA



Se connecter