100万

在

出去

聊天

禁用

双子座 2.5 闪光灯

Google DeepMind 的 Gemini 2.5 Flash 提供混合推理功能，支持文本、图像、视频和音频。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'google/gemini-2.5-flash',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="google/gemini-2.5-flash",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

300 多个适用于 OpenClaw 和 AI 代理的 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

双子座 2.5 闪光灯

产品详情

✨隆重推出 Gemini 2.5 Flash：Google DeepMind 的突破性人工智能模型

GoogleDeepMind公司发布了 双子座 2.5 闪光灯这是一款高效、经济且用途广泛的多模态人工智能模型。它专为快速推理和编码任务而设计，拥有高达百万个词元的上下文窗口，使其在 Web 开发、复杂数学和科学分析等领域表现卓越。目前，开发者和企业可通过 Google AI Studio 和 Vertex AI（预览版）访问此模型，从而在性能、运营成本和处理速度之间实现最佳平衡。

🔧 技术规格和性能分析

Gemini 2.5 Flash 采用基于 Transformer 的混合推理架构，允许开发者微调其“思考”深度，以实现最佳性能。它支持包括文本、图像、视频和音频在内的多种输入格式，并具备高级后训练功能，从而拥有卓越的推理能力。

💰 上下文窗口： 100万枚Tokens，并计划很快扩大到200万枚。
📝 产量： 每次响应最多生成 32,768 个令牌。
⚡速度： 实现了令人印象深刻的每秒 180 个令牌的输出速度，延迟低至 0.8 秒（无需思考的 TTFT）。
📈关键基准（附思考过程）：
- AIME 2025（数学）： 78.3%
- GPQA钻石（科学）： 76.5%
- SWE-Bench 验证（编码）： 58.2%
- MMLU： 0.783
💸 API 定价（每百万Tokens）：
- 输入标记： 0.1575美元
- 输出标记： 0.63美元
- 1000 个Tokens的成本（投入 + 产出，需思考）： 0.0007875美元全部的

Gemini 2.5 Flash 各项指标与其他领先型号的比较。

💡 Gemini 2.5 闪光灯的关键特性

Gemini 2.5 Flash（一款专注于推理的实验性模型）能够细致地分析任务，从而提供精准而细致的输出。其强大的多模态处理能力可无缝集成文本、图像、视频和音频，使其成为适用于各种复杂工作流程的极其通用的工具。

💻 高级编程： 在 Web 开发领域表现卓越，能够生成功能齐全且用户界面美观的 Web 应用程序（例如视频播放器、语音识别应用程序）。支持 40 多种编程语言，并支持在极少监督下进行智能编码。
🧠 超强的推理和问题解决能力： 在数学（AIME 2025：86.7%）和科学（GPQA：84%）等具有挑战性的领域取得高分，利用内在的思维过程得出合乎逻辑的结论。
🎥 多模态处理： VideoMME 得分 84.8%，促进了创新的视频到代码工作流程（例如，直接从 YouTube 视频创建学习应用程序）。
🛠️ 工具利用率： 通过函数调用和 JSON 结构与外部工具和 API 无缝集成，实现多步骤任务和复杂交互。
🌐 网站开发能力： 能够生成响应迅速、视觉效果引人入胜的 Web 应用程序，并具备波长动画和悬停效果等高级功能。
🎮 交互式模拟： 为游戏（例如，无尽跑酷游戏）和复杂的视觉效果（例如，曼德布罗特分形、机器人动画）创建可执行代码。
📡 API 功能： 提供流式传输功能、强大的函数调用和多语言支持，用于开发实时、可扩展的应用程序。

🚀 Gemini 2.5闪光灯的最佳使用场景

📱 网站开发： 打造具有动态响应设计的交互式应用程序。
🔣 代码生成： 针对复杂模拟和大型代码库的自主编码。
🔬 科学研究： 数学和科学领域的高级数据分析和问题解决。
🌈 多模态应用： 利用视频内容开发创新型学习应用程序并创建丰富的可视化效果。
💼 业务自动化： 通过无缝API集成简化业务流程。

📊 与其他领先型号的比较

与同类产品相比，Gemini 2.5 Flash 在几个关键领域脱颖而出：

✅ 与 OpenAI o3-mini 对比： Gemini 2.5 闪光灯尤其值得一提快点（每秒 180 个令牌，而大约 100 个令牌）更具成本效益无需思考（每百万个产出Tokens0.15美元，而0.30美元）。
✅ 与Claude 3.7 十四行诗： 虽然Gemini 2.5 Flash的SWE-Bench得分略低（58.2% vs. ~65%），但它的性能更胜一筹。速度和成本效益。
✅ 对比 DeepSeek R1： 虽然AIME得分较低（78.3% vs. 93.3%），但在其他方面表现显著优异多式联运能力。
✅ 对阵 Qwen3-235B-A22B： 提供更多更高的输出速度（每秒 180 个Tokens，而之前是每秒 40.1 个Tokens），而且价格是成本更低。

💻 代码示例

              // Gemini 2.5 Flash API 集成示例占位符 // 此部分通常包含交互式代码片段 // 以说明模型的使用（例如，Python、Node.js 等） // 例如： // // import { GoogleGenerativeAI } from "@google/generative-ai"; // // const genAI = new GoogleGenerativeAI(API_KEY); // const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }); // // async function run() { // const prompt = "编写一个关于人工智能探索深海的短篇故事。"; // const result = await model.generateContent(prompt); // const response = await result.response; // const text = response.text(); // console.log(text); // } // // run();          

⚠️ 需要考虑的重要限制

❌ 高延迟： 0.8 秒的 TTFT 延迟（思考模式）可能会影响实时应用程序。
❌ 实验状态： 处于预览/实验状态可能会影响稳定性并导致变更。
❌ 不支持微调： 目前不支持对特定模型进行微调。
❌ 成本增加： 采用“思考”模式会导致更高的运营成本。

🔗 无缝 API 集成

Gemini 2.5 Flash 可通过 AI/ML API 轻松访问，提供全面的流媒体功能、强大的函数调用和完整的多模态支持，使开发人员能够构建先进的智能应用程序。

❓ 常见问题解答 (FAQ)

问：Gemini 2.5闪光灯是为什么用途设计的？

答：Gemini 2.5 Flash 是一款快速、经济高效的多模态人工智能模型，针对推理和编码任务进行了优化，在 Web 开发、数学和科学分析等领域表现出色。

问：Gemini 2.5 Flash 的上下文窗口大小是多少？

答：它具有 100 万个Tokens的上下文窗口，并计划在不久的将来扩展到 200 万个Tokens。

问：与其他型号相比，它的价格如何？

答：Gemini 2.5 Flash 提供有竞争力的定价，输入Tokens每百万个Tokens 0.1575 美元，输出Tokens每百万个Tokens 0.63 美元，通常比 OpenAI o3-mini 等一些竞争对手在输出方面更具成本效益。

问：Gemini 2.5 Flash 可以处理不同类型的介质吗？

答：是的，它拥有强大的多模态功能，支持文本、图像、视频和音频输入，甚至可以促进视频到代码的工作流程。

问：Gemini 2.5闪光灯有哪些局限性？

答：主要限制包括：思考模式下的延迟相对较高（0.8 秒 TTFT）、目前处于实验阶段、缺乏微调支持以及使用“思考”模式时成本增加。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

300 多个 AI 模型
OpenClaw 和人工智能代理

节省20%的费用