qwen-bg
max-ico04
100万
出去
max-ico02
聊天
max-ico03
禁用
双子座 2.5 闪光灯
Google DeepMind 的 Gemini 2.5 Flash 提供混合推理功能,支持文本、图像、视频和音频。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'google/gemini-2.5-flash',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="google/gemini-2.5-flash",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
  • ico01-1
    API 操练场(Playground)

    在集成之前,请在沙箱环境中测试所有 API 模型。

    我们提供 300 多种模型供您集成到您的应用程序中。

    复制图片02图片01
qwenmax-bg
图片
双子座 2.5 闪光灯

产品详情

✨隆重推出 Gemini 2.5 Flash:Google DeepMind 的突破性人工智能模型

GoogleDeepMind公司发布了 双子座 2.5 闪光灯这是一款高效、经济且用途广泛的多模态人工智能模型。它专为快速推理和编码任务而设计,拥有高达百万个词元的上下文窗口,使其在 Web 开发、复杂数学和科学分析等领域表现卓越。目前,开发者和企业可通过 Google AI Studio 和 Vertex AI(预览版)访问此模型,从而在性能、运营成本和处理速度之间实现最佳平衡。

🔧 技术规格和性能分析

Gemini 2.5 Flash 采用基于 Transformer 的混合推理架构,允许开发者微调其“思考”深度,以实现最佳性能。它支持包括文本、图像、视频和音频在内的多种输入格式,并具备高级后训练功能,从而拥有卓越的推理能力。

  • 💰 上下文窗口: 100万枚Tokens,并计划很快扩大到200万枚。
  • 📝 产量: 每次响应最多生成 32,768 个令牌。
  • ⚡速度: 实现了令人印象深刻的每秒 180 个令牌的输出速度,延迟低至 0.8 秒(无需思考的 TTFT)。
  • 📈关键基准(附思考过程):
    • AIME 2025(数学): 78.3%
    • GPQA钻石(科学): 76.5%
    • SWE-Bench 验证(编码): 58.2%
    • MMLU: 0.783
  • 💸 API 定价(每百万Tokens):
    • 输入标记: 0.1575美元
    • 输出标记: 0.63美元
    • 1000 个Tokens的成本(投入 + 产出,需思考): 0.0007875美元 全部的
2.5 闪光指标
Gemini 2.5 Flash 各项指标与其他领先型号的比较。

💡 Gemini 2.5 闪光灯的关键特性

Gemini 2.5 Flash(一款专注于推理的实验性模型)能够细致地分析任务,从而提供精准而细致的输出。其强大的多模态处理能力可无缝集成文本、图像、视频和音频,使其成为适用于各种复杂工作流程的极其通用的工具。

  • 💻 高级编程: 在 Web 开发领域表现卓越,能够生成功能齐全且用户界面美观的 Web 应用程序(例如视频播放器、语音识别应用程序)。支持 40 多种编程语言,并支持在极少监督下进行智能编码。
  • 🧠 超强的推理和问题解决能力: 在数学(AIME 2025:86.7%)和科学(GPQA:84%)等具有挑战性的领域取得高分,利用内在的思维过程得出合乎逻辑的结论。
  • 🎥 多模态处理: VideoMME 得分 84.8%,促进了创新的视频到代码工作流程(例如,直接从 YouTube 视频创建学习应用程序)。
  • 🛠️ 工具利用率: 通过函数调用和 JSON 结构与外部工具和 API 无缝集成,实现多步骤任务和复杂交互。
  • 🌐 网站开发能力: 能够生成响应迅速、视觉效果引人入胜的 Web 应用程序,并具备波长动画和悬停效果等高级功能。
  • 🎮 交互式模拟: 为游戏(例如,无尽跑酷游戏)和复杂的视觉效果(例如,曼德布罗特分形、机器人动画)创建可执行代码。
  • 📡 API 功能: 提供流式传输功能、强大的函数调用和多语言支持,用于开发实时、可扩展的应用程序。

🚀 Gemini 2.5闪光灯的最佳使用场景

  • 📱 网站开发: 打造具有动态响应设计的交互式应用程序。
  • 🔣 代码生成: 针对复杂模拟和大型代码库的自主编码。
  • 🔬 科学研究: 数学和科学领域的高级数据分析和问题解决。
  • 🌈 多模态应用: 利用视频内容开发创新型学习应用程序并创建丰富的可视化效果。
  • 💼 业务自动化: 通过无缝API集成简化业务流程。

📊 与其他领先型号的比较

与同类产品相比,Gemini 2.5 Flash 在几个关键领域脱颖而出:

  • ✅ 与 OpenAI o3-mini 对比: Gemini 2.5 闪光灯尤其值得一提 快点 (每秒 180 个令牌,而大约 100 个令牌) 更具成本效益 无需思考(每百万个产出Tokens0.15美元,而0.30美元)。
  • ✅ 与Claude 3.7 十四行诗: 虽然Gemini 2.5 Flash的SWE-Bench得分略低(58.2% vs. ~65%),但它的性能更胜一筹。 速度和成本效益
  • ✅ 对比 DeepSeek R1: 虽然AIME得分较低(78.3% vs. 93.3%),但在其他方面表现显著优异 多式联运能力
  • ✅ 对阵 Qwen3-235B-A22B: 提供更多 更高的输出速度 (每秒 180 个Tokens,而之前是每秒 40.1 个Tokens),而且价格是 成本更低

💻 代码示例

// Gemini 2.5 Flash API 集成示例占位符 // 此部分通常包含交互式代码片段 // 以说明模型的使用(例如,Python、Node.js 等) // 例如: // // import { GoogleGenerativeAI } from "@google/generative-ai"; // // const genAI = new GoogleGenerativeAI(API_KEY); // const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }); // // async function run() { // const prompt = "编写一个关于人工智能探索深海的短篇故事。"; // const result = await model.generateContent(prompt); // const response = await result.response; // const text = response.text(); // console.log(text); // } // // run();

⚠️ 需要考虑的重要限制

  • ❌ 高延迟: 0.8 秒的 TTFT 延迟(思考模式)可能会影响实时应用程序。
  • ❌ 实验状态: 处于预览/实验状态可能会影响稳定性并导致变更。
  • ❌ 不支持微调: 目前不支持对特定模型进行微调。
  • ❌ 成本增加: 采用“思考”模式会导致更高的运营成本。

🔗 无缝 API 集成

Gemini 2.5 Flash 可通过 AI/ML API 轻松访问,提供全面的流媒体功能、强大的函数调用和完整的多模态支持,使开发人员能够构建先进的智能应用程序。

❓ 常见问题解答 (FAQ)

问:Gemini 2.5闪光灯是为什么用途设计的?

答:Gemini 2.5 Flash 是一款快速、经济高效的多模态人工智能模型,针对推理和编码任务进行了优化,在 Web 开发、数学和科学分析等领域表现出色。

问:Gemini 2.5 Flash 的上下文窗口大小是多少?

答:它具有 100 万个Tokens的上下文窗口,并计划在不久的将来扩展到 200 万个Tokens。

问:与其他型号相比,它的价格如何?

答:Gemini 2.5 Flash 提供有竞争力的定价,输入Tokens每百万个Tokens 0.1575 美元,输出Tokens每百万个Tokens 0.63 美元,通常比 OpenAI o3-mini 等一些竞争对手在输出方面更具成本效益。

问:Gemini 2.5 Flash 可以处理不同类型的介质吗?

答:是的,它拥有强大的多模态功能,支持文本、图像、视频和音频输入,甚至可以促进视频到代码的工作流程。

问:Gemini 2.5闪光灯有哪些局限性?

答:主要限制包括:思考模式下的延迟相对较高(0.8 秒 TTFT)、目前处于实验阶段、缺乏微调支持以及使用“思考”模式时成本增加。

了解如何利用 AICC API 实现公司转型

探索如何利用 AICC API 革新您的业务!解锁强大的工具,实现流程自动化、增强决策能力并打造个性化的客户体验。
联系销售
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用