qwen-bg
max-ico04
出去
max-ico02
聊天
max-ico03
禁用
稳定的 TripoSR 3D
TripoSR API 使用 Transformer 架构进行高效重建,可在 0.5 秒内从单张图像生成高质量的 3D 网格。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const fs = require('fs');
const { Readable } = require('stream');
const { finished } = require('stream/promises');

const main = async () => {
  const {
    model_mesh: { url, file_name },
  } = await fetch('https://api.ai.cc/v1/image/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'triposr',
      image_url: 'https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png',
    }),
  }).then((res) => res.json());

  const { body } = await fetch(url);
  const stream = fs.createWriteStream(`./${file_name}`);
  await finished(Readable.fromWeb(body).pipe(stream));
};

main();
                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "triposr",
            "image_url": "https://upload.wikimedia.org/wikipedia/commons/7/7a/Basketball.png",
        },
    )

    response.raise_for_status()
    data = response.json()
    url = data["model_mesh"]["url"]
    file_name = data["model_mesh"]["file_name"]

    mesh_response = requests.get(url, stream=True)

    with open(file_name, "wb") as file:
        for chunk in mesh_response.iter_content(chunk_size=8192):
            file.write(chunk)


if __name__ == "__main__":
    main()
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
  • ico01-1
    API 操练场(Playground)

    在集成之前,请在沙箱环境中测试所有 API 模型。

    我们提供 300 多种模型供您集成到您的应用程序中。

    复制图片02图片01
qwenmax-bg
图片
稳定的 TripoSR 3D

产品详情

TripoSR 简介:革新图像到 3D 重建

TripoSR 是由以下机构联合开发的突破性基于Transformer的模型: 稳定性人工智能Tripo AI该版本 1.0 于 2024 年 3 月 4 日发布,为快速 3D 物体重建树立了新标准。它能够仅使用一张 RGB 图像就生成高质量的 3D 网格,并且在不到 100 秒的时间内即可完成这一壮举。 0.5秒 在NVIDIA A100 GPU上。

💡 主要功能和特性

  • 🚀 超高速一代: 在 0.5 秒内实现前馈 3D 生成。
  • 🧠 高级Transformer架构: 采用高效的变压器设计,可进行复杂的处理。
  • 高质量3D网格: 生成精细、精确的3D网格输出。
  • 🖼️ 单张图像输入: 仅需一张 RGB 图片即可简化流程。
  • 🏆 卓越的性能: 在倒角距离和 F 值指标方面领先于竞争对手。

🎯 预期用途

TripoSR专为需要直接从2D图像快速生成3D可视化结果的行业而设计。其主要应用包括:

  • 娱乐: 用于电影和动画中快速创建素材。
  • 赌博: 快速原型制作和游戏素材生成。
  • 工业设计: 快速实现产品概念可视化。
  • 建筑学: 快速将建筑草图或照片转换为 3D 模型。

TripoSR 是一种图像到 3D 模型转换工具,它独立于人类语言运行,因此具有普遍适用性。

⚙️ 技术深度解析

模型架构

TripoSR 的复杂架构融合了基于 Transformer 的组件,并经过精心优化,可实现卓越的 3D 重建:

  1. 图像编码器:
    • 利用DINOv1预训练视觉Transformer模型。
    • 将 RGB 图像转换为潜在向量,捕捉全局和局部特征。
  2. 图像到三平面解码器:
    • 基于变压器的解码器。
    • 将潜在向量转换为三平面 NeRF(神经辐射场)表示。
    • 采用先进的注意力机制来学习三平面各组成部分之间的复杂关系。
  3. 基于三平面的神经辐射场(NeRF):
    • 生成 3D 模型的最后阶段。
    • 专为有效处理复杂形状和纹理而优化。

训练数据

该模型基于精心挑选的扩展数据集子集进行了严格训练。 已发布数据集特意选择这首页公司是因为它专注于逼真、高质量的 3D 模型。

绩效指标

TripoSR 在定量和定性评估中始终优于其他开源替代方案。它在关键指标方面表现出色,例如: 倒角距离F 分数 涵盖各种不同的数据集。

📊 与其他型号的比较

  • ✔️ 准确性: 与其他开源解决方案相比,提供更优异的 3D 重建质量。
  • 速度: 在短时间内生成复杂的 3D 网格 0.5秒 在NVIDIA A100 GPU上。
  • 🛡️ 鲁棒性: 通过动态推断相机参数,无需依赖显式条件,即可对各种成像条件表现出卓越的适应性。

🛠️ 使用与许可

代码示例

对于希望集成 TripoSR 的开发者,我们提供了代码示例和文档。您可以 浏览 TripoSR 的官方公告和资源 请参阅详细的实施指南。

道德准则与许可

TripoSR是在宽松的许可下发布的 MIT许可证这促进了开源开发,并鼓励在包括人工智能、计算机视觉和计算机图形应用在内的各个领域负责任地实施开源项目。MIT许可证允许广泛使用,涵盖商业、个人和研究应用。

借助 TripoSR 的先进功能,开发人员能够以前所未有的速度和精度打造强大的 3D 重建应用程序。这一突破为依赖快速 2D 到 3D 转换的各个领域开辟了令人兴奋的新可能性。

常见问题解答 (FAQ)

问:TripoSR是什么?
答:TripoSR是由Stability AI和Tripo AI联合开发的一种先进的图像到3D重建模型。它可以从单张2D RGB图像快速生成高质量的3D网格。
问:TripoSR 生成 3D 模型的速度有多快?
答:在NVIDIA A100 GPU上运行时,它可以在0.5秒内生成3D网格,使其成为目前最快的解决方案之一。
问:TripoSR 需要什么样的输入?
答:TripoSR 只需要一张 RGB 图像即可进行 3D 物体重建。
问:TripoSR的主要应用有哪些?
答:它非常适合娱乐、游戏、工业设计和建筑等领域的应用,在这些领域中,从 2D 图像快速实现 3D 可视化至关重要。
问:TripoSR的授权许可是什么?
答:TripoSR 采用宽松的 MIT 许可证发布,允许将其用于商业、个人和研究目的,从而促进开放和负责任的 AI 开发。

了解如何利用 AICC API 实现公司转型

探索如何利用 AICC API 革新您的业务!解锁强大的工具,实现流程自动化、增强决策能力并打造个性化的客户体验。
联系销售
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用