



const fs = require('fs');
const path = require('path');
const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'tencent/hunyuan-part',
mesh_url: 'https://storage.googleapis.com/falserverless/model_tests/video_models/base_basic_shaded.glb',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "tencent/hunyuan-part",
"mesh_url": "https://storage.googleapis.com/falserverless/model_tests/video_models/base_basic_shaded.glb",
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

产品详情
💡释放精度:浑源零件 API 概述
混源部件 API 经过精心设计,旨在 精细的图像编辑和复杂的合成任务这款强大的工具使用户能够选择性地修改、优化甚至重绘图像中的特定元素,例如背景、复杂的光照、各种物体或纹理。更重要的是,它在实现这些精确修改的同时,严格保留了原始图像的连贯风格、环境光照和整体场景氛围。其应用范围广泛,从专业照片修饰和高级照片蒙太奇,到增强其他人工智能模型生成的图像,均可胜任。
技术规格
- ✓ 型号类型: 一种先进的基于Transformer的图像编辑、图像修复和区域细化网络,是混元模型系列不可或缺的一部分。
- ✓ 输入/输出: 它接受一张输入图像(可以选择添加蒙版来定义具体的编辑区域)以及明确的编辑指令。然后,它输出一张经过精细编辑的图像,该图像能够精确匹配输入图像的原始分辨率、风格和光照特征。
- ✓ 建筑: 基于统一的自回归框架构建,专门针对高精度局部区域编辑进行了优化。
- ✓ 推理速度: 由于采用了高效的部件级处理方式,与需要进行全图像编辑的解决方案相比,处理时间显著缩短。
- ✓ 支持的分辨率: 优惠 兼容高达 4K 的高分辨率满足专业级应用的需求。
性能基准
- ★ 高保真: 编辑过的区域瑕疵极少,能够无缝自然地融入原始场景。
- ★ 灯光和风格一致性: 在保持原有光照和艺术风格方面表现出卓越的能力,优于许多通用的修复模型。
- ★ 高级照片蒙太奇: 显著减少复杂照片蒙太奇工作流程中典型的接缝和边缘瑕疵,尤其是在集成用户提供的图像元素时。
- ★ 减少“占地面积”: 取得了显著成就 可见编辑“痕迹”减少 20-30% 与旧款编辑模型相比,内部测试中出现了(例如模糊、边缘条纹、阴影不一致等问题)。
主要特点
- 🔍 精确的部件级编辑: 使用户能够以无与伦比的精度定位和修改图像的特定区域,而不会干扰整体构图或光照。
- 🌟 无缝风格保留: 保证所有编辑区域的色彩和光照一致,确保编辑部分自然融合,与原图无异。
- 🖼 图像修补和图像删减功能: 完全支持精确的图像修复,用于修饰损坏或不需要的区域;同时支持强大的图像扩展功能,用于智能地将图像内容扩展到其原始边界之外。
- 🔘 与其他人工智能模型的兼容性: 旨在通过允许进行详细而精确的调整,来增强和改进各种其他生成式 AI 模型创建的图像。
- 🧠 高级语义理解: 利用多模态线索深入理解复杂的视觉内容和用户意图,从而进行高度精细且符合上下文的编辑。
- 🎨 高保真输出: 能够生成质量卓越的逼真照片级编辑效果,使其成为要求苛刻的专业摄影和设计任务的理想之选。
Hunyuan Part API Pricing
💰 每代成本: 0.042美元
混元部件的主要应用场景
- 📷 专业照片修图: 这款软件非常适合校正或增强人像、背景和光线,以及无缝移除或添加物体,同时严格保留原始摄影风格。
- 🖼 高级照片合成: 能够将多个图像或组件巧妙地组合成一个单一的、连贯的场景,并具有完全一致的光照和艺术风格。
- 🎬 视觉特效与广告: 可实现精确的场景调整、细致的对象插入或移除,以及逼真的背景替换和自然融合。
- 🛍 产品及电商影像: 非常适合增强产品照片效果、更换背景、调整照明、微调反射率或材质一致性,以达到最佳展示效果。
代码示例参考
有关详细的实现指南和功能示例,请参阅官方 API 文档。一个常见的用例是: “基于腾讯/混源零件的图像网格到网格”它提供了全面的代码片段。
混源零件 vs. 领先的人工智能和创意工具
✅ 与 Adobe Photoshop 相比: 混源零件提供高度专业化的, 精确的部件级编辑 专为无缝修复和去除图像而设计,同时保留整体场景风格和光照。Photoshop 的 AI 工具侧重于更广泛的图像处理和内容感知填充,但通常需要手动调整才能实现自然的混合和光照一致性。
✅ 对阵 DALL·E: DALL·E虽然擅长根据文本提示进行创意图像生成和粗略图像修复,但有时会在细节区域产生风格不一致或明显的瑕疵。混源部分则专注于此。 保留细节的局部编辑 它能够一丝不苟地保持原始图像的精确光线和风格,使其在专业级修图和 AI 图像增强工作流程中表现出色。
✅ 与稳定扩散相比: 稳定的扩散模型因其多功能性,常用于文本转图像和图像修复,但通常会在编辑区域产生光照和风格一致性较差的问题。混元部分通过更精确的语义理解超越了它们,并且 部分级编辑期间的光度相干性,能够呈现更自然、更逼真的编辑效果,尤其是在高分辨率图像中。
✅ 对比 Runway ML: Runway ML 提供快速且用户友好的 AI 驱动编辑工具,可快速创建质量尚可的内容,但可能缺乏对细微光照和纹理细节的精细控制。相比之下,混元部分则专注于…… 局部编辑的精确性和照片级真实感通常,需要高保真输出而不是快速、大范围编辑的专业人士会选择这种方式。
常见问题解答 (FAQ)
Q1:混源部件API的核心功能是什么?
A1:它的主要目的是 精细的图像编辑和合成允许用户在保留原始风格和上下文的同时,精确地修改图像的特定部分。
Q2:混源零件是否支持高分辨率图像?
A2:是的,API 的设计目的就是为了处理 支持高达 4K 的高分辨率输入和输出非常适合专业用途。
Q3:混源部分如何确保编辑后的图像自然融合?
A3:它的特点 无缝风格保留它在所有编辑区域中保持一致的调色板和光照,以实现自然融合。
Q4:此 API 是否可用于扩展图像或修复损坏区域?
A4:当然。它两者都支持。 补漆(用于修复/去除)和外涂(用于扩展) 图像内容具有很高的准确性。
Q5:混源零件API的使用定价结构是怎样的?
A5:混元零件API的定价为 每代0.042美元。



登录