qwen-bg
max-ico04
出去
max-ico02
聊天
max-ico03
禁用
图3
Google 的 Imagen 3 可以根据文本生成逼真的图像;通过 Vertex AI 输出更安全的图像。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const fs = require('fs');
const path = require('path');

const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      prompt: 'A jellyfish in the ocean',
      model: 'imagen-3.0-generate-002',
    }),
  }).then((res) => res.json());

  response['data'].forEach((image, i) => {
    const buffer = Buffer.from(image['url'], 'base64');
    fs.writeFileSync(path.join(__dirname, `image_${i + 1}.png`), buffer);
});
};

main();

                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A jellyfish in the ocean",
            "model": "imagen-3.0-generate-002",
        },
    )

    response.raise_for_status()
    data = response.json()

    for i, image in enumerate(data["data"]):
        with open(f"image_{i+1}.png", "wb") as f:
            f.write(base64.b64decode(image["url"]))


if __name__ == "__main__":
    main()
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
  • ico01-1
    API 操练场(Playground)

    在集成之前,请在沙箱环境中测试所有 API 模型。

    我们提供 300 多种模型供您集成到您的应用程序中。

    复制图片02图片01
qwenmax-bg
图片
图3

产品详情

✨ 图片 3 简介

图3 是Google最先进的文本转图像人工智能模型,它彻底改变了我们根据简单的文本描述创建逼真图像的方式。发布于 2024年7月此版本在前代产品的基础上进行了全面升级,提供了无与伦比的细节、光照效果,并显著减少了视觉瑕疵。它为自然语言理解树立了新的标杆,并大幅改进了图像中的文本渲染,开启了无限的创作可能。

“Imagen 3 是Google最新的文本转图像 AI 模型,旨在根据文本描述生成高质量、逼真的图像,并改进细节、光照,减少伪影。”
——引自 原始图像 3 描述

🔑 Imagen 3 的主要功能

  • ✨ 高质量图像生成: 能够创建细节丰富、光照更丰富、视觉瑕疵最少的逼真图像。
  • 💡增强自然语言理解能力: 显著提高了对复杂提示的解读能力,减少了对复杂提示设计的需要。
  • ✍️ 更佳的文本渲染效果: 在生成的图像中提供卓越的文本渲染效果,扩展创意应用。
  • 🧠 情境意识与连贯性: 采用复杂的场景合成机制,确保生成的图像具有逻辑一致性。
  • 🔍更高分辨率和更逼真的效果: 生成超高清图像,其清晰度几乎与真实照片无异。

🎯 预期使用场景

Imagen 3 非常适合在各种应用程序中根据文本描述生成逼真的图像,包括 市场营销、广告、设计和创意项目它非常适合需要定制视觉效果的企业以及需要高质量图像生成功能的应用程序开发人员。

⚙️ 技术细节

  • 建筑学: 利用深度学习方法,将语言模型(如Google的 T5)与生成对抗网络 (GAN) 或扩散模型相结合。
  • 训练数据: 基于海量文本-图像对数据集进行训练,并添加了丰富的图像描述以捕捉更细微的差别。
  • 多样性与偏见: 结合广泛的过滤和数据标注,最大限度地减少训练数据集中的有害内容,确保负责任的人工智能生成。

📈 绩效指标

  • 视觉质量: 在视觉质量方面获得最高分,生成美观且基本无瑕疵的图像。
  • 及时准确: 对复杂提示的回答表现出很高的准确性。

📊 与其他型号的比较

GenAI-Bench 的人工评估始终表明,Imagen 3 在整体偏好基准测试中优于其他领先模型。

Imagen 3 与其他模型的 GenAI-Bench Elo 得分比较
GenAI-Bench 上的人工评价:Imagen 3 与其他模型在整体偏好基准测试中的 Elo 分数。
Imagen 3 与其他模型相比的 GenAI-Bench 胜率百分比
GenAI-Bench 的人工评估:Imagen 3 与其他模型相比的总体偏好胜率百分比。

🚀 Imagen 3 入门指南

代码示例:

使用提供的代码片段将 Imagen 3 集成到您的应用程序中。生成的图像将直接保存到您的计算机。

图像生成参数:

  • num_images [int]: 指定要生成的图像数量。
  • 种子 [int]: 设置用于生成可复现图像的随机种子。
  • enhance_prompt [布尔值]: 此参数为可选参数,用于启用基于 LLM 的提示重写功能,以生成更高质量的图像,使其更好地符合原始提示的意图。禁用此功能可能会影响图像质量和提示的准确性。
  • convert_base64_to_url [boolean]: 如果为真,则返回图像 URL;否则,将以 base64 格式提供图像文件。
  • 宽高比 [1:1, 9:16, 16:9, 3:4, 4:3]: 定义生成图像的宽高比。
  • person_generation [dont_allow, allow_adult]: 通过模型控制人口的生成。
  • 安全设置 [block_low_and_above, block_medium_and_above, block_only_high]: 为安全机制增加一道过滤屏障。

预期回复格式:

生成成功后,您将收到类似于这样的 JSON 响应:

{  "data" : [ { "mime_type" : "image/png" , "url" : "base64image / url" , "prompt" : "增强提示" } ] }

该模型很容易获取。 AI/ML API平台 名称为“Imagen 3”。

完整的 API 文档:

详细的 API 文档 可供寻求深入信息的开发人员使用。

🛡️ 伦理准则与负责任的人工智能

  • 安全第一: 开发过程中始终将安全性和责任感放在首位,严格遵守Google人工智能原则。
  • 数字水印(SynthID): 包含 SynthID,可清晰识别 AI 生成的内容,从而提高透明度。
  • 有害内容预防: 采用先进的安全过滤技术,严格防止有害内容的产生。
  • 数据治理: 采用健全的数据治理政策,确保客户数据绝不用于培训目的。

📄 许可与使用

使用 Imagen 3 时,务必遵守 Google 的负责任人工智能和使用准则。对于某些特定场景,例如生成包含人物的图像,可能需要获得 Google 的额外批准。如果您的项目涉及创建此类图像,请确保遵循必要的审批流程。

访问 Imagen 3 API,开启您的创意之旅 这里

❓ 常见问题解答 (FAQ)

  • Q1:Imagen 3 是什么?

    A1:Imagen 3 是Google最新的文本到图像 AI 模型,于 2024 年 7 月发布,旨在根据文本描述生成高质量、逼真的图像,并增强细节、光照和自然语言理解能力。

  • Q2:Imagen 3 相较于之前的版本有哪些改进?

    A2:它提供更优质的图像质量、更丰富的照明、更少的视觉瑕疵、对复杂提示的更好理解、图像中更清晰的文本渲染以及更高分辨率的生成。

  • Q3:我可以将 Imagen 3 用于商业项目吗?

    A3:是的,Imagen 3 可用于包括市场营销、广告和设计在内的多种应用。但是,某些特定用途,例如生成人物图像,可能需要获得 Google 的额外批准。

  • 第四季度:针对人工智能的合乎伦理的使用,有哪些措施已经落实?

    A4:Imagen 3 采用了数字水印(SynthID)技术,使用安全过滤器来防止有害内容,并遵循严格的数据治理政策,符合Google的人工智能原则。

  • Q5:我可以在哪里访问 Imagen 3 API?

    A5:Imagen 3 API 可在以下平台获取: AI/ML API平台您可以查看详细的 API 文档。 这里

了解如何利用 AICC API 实现公司转型

探索如何利用 AICC API 革新您的业务!解锁强大的工具,实现流程自动化、增强决策能力并打造个性化的客户体验。
联系销售
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用