



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'google/gemini-2.5-flash',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="google/gemini-2.5-flash",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")
- API 操练场(Playground)

在集成之前,请在沙箱环境中测试所有 API 模型。
我们提供 300 多种模型供您集成到您的应用程序中。


产品详情
✨隆重推出 Gemini 2.5 Flash:Google DeepMind 的突破性人工智能模型
GoogleDeepMind公司发布了 双子座 2.5 闪光灯这是一款高效、经济且用途广泛的多模态人工智能模型。它专为快速推理和编码任务而设计,拥有高达百万个词元的上下文窗口,使其在 Web 开发、复杂数学和科学分析等领域表现卓越。目前,开发者和企业可通过 Google AI Studio 和 Vertex AI(预览版)访问此模型,从而在性能、运营成本和处理速度之间实现最佳平衡。
🔧 技术规格和性能分析
Gemini 2.5 Flash 采用基于 Transformer 的混合推理架构,允许开发者微调其“思考”深度,以实现最佳性能。它支持包括文本、图像、视频和音频在内的多种输入格式,并具备高级后训练功能,从而拥有卓越的推理能力。
- 💰 上下文窗口: 100万枚Tokens,并计划很快扩大到200万枚。
- 📝 产量: 每次响应最多生成 32,768 个令牌。
- ⚡速度: 实现了令人印象深刻的每秒 180 个令牌的输出速度,延迟低至 0.8 秒(无需思考的 TTFT)。
- 📈关键基准(附思考过程):
- AIME 2025(数学): 78.3%
- GPQA钻石(科学): 76.5%
- SWE-Bench 验证(编码): 58.2%
- MMLU: 0.783
- 💸 API 定价(每百万Tokens):
- 输入标记: 0.1575美元
- 输出标记: 0.63美元
- 1000 个Tokens的成本(投入 + 产出,需思考): 0.0007875美元 全部的

💡 Gemini 2.5 闪光灯的关键特性
Gemini 2.5 Flash(一款专注于推理的实验性模型)能够细致地分析任务,从而提供精准而细致的输出。其强大的多模态处理能力可无缝集成文本、图像、视频和音频,使其成为适用于各种复杂工作流程的极其通用的工具。
- 💻 高级编程: 在 Web 开发领域表现卓越,能够生成功能齐全且用户界面美观的 Web 应用程序(例如视频播放器、语音识别应用程序)。支持 40 多种编程语言,并支持在极少监督下进行智能编码。
- 🧠 超强的推理和问题解决能力: 在数学(AIME 2025:86.7%)和科学(GPQA:84%)等具有挑战性的领域取得高分,利用内在的思维过程得出合乎逻辑的结论。
- 🎥 多模态处理: VideoMME 得分 84.8%,促进了创新的视频到代码工作流程(例如,直接从 YouTube 视频创建学习应用程序)。
- 🛠️ 工具利用率: 通过函数调用和 JSON 结构与外部工具和 API 无缝集成,实现多步骤任务和复杂交互。
- 🌐 网站开发能力: 能够生成响应迅速、视觉效果引人入胜的 Web 应用程序,并具备波长动画和悬停效果等高级功能。
- 🎮 交互式模拟: 为游戏(例如,无尽跑酷游戏)和复杂的视觉效果(例如,曼德布罗特分形、机器人动画)创建可执行代码。
- 📡 API 功能: 提供流式传输功能、强大的函数调用和多语言支持,用于开发实时、可扩展的应用程序。
🚀 Gemini 2.5闪光灯的最佳使用场景
- 📱 网站开发: 打造具有动态响应设计的交互式应用程序。
- 🔣 代码生成: 针对复杂模拟和大型代码库的自主编码。
- 🔬 科学研究: 数学和科学领域的高级数据分析和问题解决。
- 🌈 多模态应用: 利用视频内容开发创新型学习应用程序并创建丰富的可视化效果。
- 💼 业务自动化: 通过无缝API集成简化业务流程。
📊 与其他领先型号的比较
与同类产品相比,Gemini 2.5 Flash 在几个关键领域脱颖而出:
- ✅ 与 OpenAI o3-mini 对比: Gemini 2.5 闪光灯尤其值得一提 快点 (每秒 180 个令牌,而大约 100 个令牌) 更具成本效益 无需思考(每百万个产出Tokens0.15美元,而0.30美元)。
- ✅ 与Claude 3.7 十四行诗: 虽然Gemini 2.5 Flash的SWE-Bench得分略低(58.2% vs. ~65%),但它的性能更胜一筹。 速度和成本效益。
- ✅ 对比 DeepSeek R1: 虽然AIME得分较低(78.3% vs. 93.3%),但在其他方面表现显著优异 多式联运能力。
- ✅ 对阵 Qwen3-235B-A22B: 提供更多 更高的输出速度 (每秒 180 个Tokens,而之前是每秒 40.1 个Tokens),而且价格是 成本更低。
💻 代码示例
// Gemini 2.5 Flash API 集成示例占位符 // 此部分通常包含交互式代码片段 // 以说明模型的使用(例如,Python、Node.js 等) // 例如: // // import { GoogleGenerativeAI } from "@google/generative-ai"; // // const genAI = new GoogleGenerativeAI(API_KEY); // const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }); // // async function run() { // const prompt = "编写一个关于人工智能探索深海的短篇故事。"; // const result = await model.generateContent(prompt); // const response = await result.response; // const text = response.text(); // console.log(text); // } // // run(); ⚠️ 需要考虑的重要限制
- ❌ 高延迟: 0.8 秒的 TTFT 延迟(思考模式)可能会影响实时应用程序。
- ❌ 实验状态: 处于预览/实验状态可能会影响稳定性并导致变更。
- ❌ 不支持微调: 目前不支持对特定模型进行微调。
- ❌ 成本增加: 采用“思考”模式会导致更高的运营成本。
🔗 无缝 API 集成
Gemini 2.5 Flash 可通过 AI/ML API 轻松访问,提供全面的流媒体功能、强大的函数调用和完整的多模态支持,使开发人员能够构建先进的智能应用程序。
❓ 常见问题解答 (FAQ)
问:Gemini 2.5闪光灯是为什么用途设计的?
答:Gemini 2.5 Flash 是一款快速、经济高效的多模态人工智能模型,针对推理和编码任务进行了优化,在 Web 开发、数学和科学分析等领域表现出色。
问:Gemini 2.5 Flash 的上下文窗口大小是多少?
答:它具有 100 万个Tokens的上下文窗口,并计划在不久的将来扩展到 200 万个Tokens。
问:与其他型号相比,它的价格如何?
答:Gemini 2.5 Flash 提供有竞争力的定价,输入Tokens每百万个Tokens 0.1575 美元,输出Tokens每百万个Tokens 0.63 美元,通常比 OpenAI o3-mini 等一些竞争对手在输出方面更具成本效益。
问:Gemini 2.5 Flash 可以处理不同类型的介质吗?
答:是的,它拥有强大的多模态功能,支持文本、图像、视频和音频输入,甚至可以促进视频到代码的工作流程。
问:Gemini 2.5闪光灯有哪些局限性?
答:主要限制包括:思考模式下的延迟相对较高(0.8 秒 TTFT)、目前处于实验阶段、缺乏微调支持以及使用“思考”模式时成本增加。



登录