512

在

出去

聊天

禁用

Vicuna FastChat T5 (3B)

LM-SYS 的 FastChat-T5 API 是一款开源聊天机器人，它使用 70,000 个 ShareGPT 对话进行了微调，以适应各种对话任务。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'lmsys/fastchat-t5-3b-v1.0',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="lmsys/fastchat-t5-3b-v1.0",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

Vicuna FastChat T5 (3B)

产品详情

💬 Vicuna FastChat-T5：一款先进的开源聊天机器人模型

由……开发 LM-SYS (primarily Dacheng Li, Lianmin Zheng, and Hao Zhang) and released in April 2023, FastChat-T5 (3B) 是一款创新的开源聊天机器人，专为对话式人工智能而设计。该基于文本的模型通过对大量真实世界对话进行细致的微调，显著增强了 Flan-t5-xl 模型（30 亿个参数）。

它采用了一种 编码器-解码器转换器架构 能够对用户输入生成高度相关和自然的响应，使其成为各种自然语言处理 (NLP) 任务的强大工具。

✅ 主要功能概览

建筑学： 用于稳健理解和生成的编码器-解码器转换器。
训练数据： 使用来自 ShareGPT 的 70,000 条对话的大型数据集进行微调。
响应生成： 利用自回归生成算法生成连贯且具有上下文感知能力的输出。
优化： 在微调过程中，具有优化的学习率和预热比，以实现卓越的性能。
执照： 采用宽松的 Apache License 2.0 许可，支持广泛使用。

💻 预期应用及语言支持

设计用途广泛： FastChat-T5 专为商业聊天机器人应用和自然语言处理领域的前沿研究而设计。它能够生成对话代理的动态响应、提升客户服务水平，并支持各种其他自然语言处理任务。

主要语言： 该模型主要支持英语虽然它可能能够处理其他语言，但由于其训练数据主要以英语为主，因此准确性可能会降低。

⚒ 技术架构与培训洞察

核心架构： FastChat-T5 利用了先进的技术 编码器-解码器变压器 建筑学。

编码器 对输入文本进行双向处理，创建丰富的隐藏表示。
解码器 然后策略性地利用这些表征上的交叉注意力来生成响应，从初始标记开始自回归生成。

训练数据细分：

来源： 这是一份精心收集的、包含7万条对话的庞大资料库。 ShareGPT.com。
自然： 用户共享的对话数据，经过预处理，形成有效的问答对。
知识门槛： 该模型的知识库更新至…… 2023年4月。

多样性与潜在偏见： 训练数据涵盖了广泛的对话场景和用户交互。然而，必须指出的是，该数据集可能继承了ShareGPT上用户分享内容中存在的某些偏差，这可能会影响模型的输出。

📊 性能基准测试

准确性洞察： 尽管参数较少，FastChat-T5 在多个关键领域始终展现出优于 Dolly-V2-12B 等型号的性能。其优势体现在以下方面：

通用任务类型
角色扮演场景
常识推理
反事实任务

速度与效率： 该模型经过精细优化，可实现高效推理，尤其是在GPU加速的系统上。其微调过程采用了复杂的余弦学习率调度算法，并结合0.03的预热比，从而提高了模型的速度和稳定性。

稳健性和局限性： FastChat-T5 在各种输入类型中都展现出很强的鲁棒性。然而，它目前的能力在编程和高级数学任务等专业领域存在局限性，与专门针对这些领域设计的模型相比，其得分往往较低。

💼 使用指南和伦理考量

代码示例： 开发者可以将 FastChat-T5 集成到他们的应用程序中。一个类似于 OpenAI 聊天补全 API 的示例代码片段可能如下所示：

 import openai openai.api_base = "YOUR_FASTCHAT_API_BASE_URL" # 例如，"http://localhost:8000/v1" openai.api_key = "EMPTY" # 本地 FastChat 部署并非绝对必要 messages = [ {"role": "system", "content": "您是一位乐于助人的助手。"}, {"role": "user", "content": "给我讲个笑话。"}, ] completion = openai.ChatCompletion.create( model="lmsys/fastchat-t5-3b-v1.0", # 指定模型标识符 messages=messages, temperature=0.7, ) print(completion.choices[0].message.content)

注意：原文中的 `snippet` 标签已被解释为典型 API 使用示例的占位符。此代码仅供参考，可能需要特定的 FastChat-T5 服务器配置。

道德使用与偏见意识： 与任何基于大型数据集训练的人工智能模型一样，FastChat-T5 也可能无意中继承了其 ShareGPT 训练数据中存在的偏差。强烈建议用户谨慎行事，并注意潜在的伦理问题，包括生成带有偏见或有害的输出结果。建议定期监控并进行人工监督。

许可证信息： FastChat-T5 在以下情况下运行： Apache 许可证 2.0，这是一个高度灵活的开源许可证，允许商业和非商业部署及修改。

❓ 关于 FastChat-T5 的常见问题解答 (FAQ)

Q1: FastChat-T5是什么？它是谁开发的？
A1：FastChat-T5 是一个基于 Flan-t5-xl 的开源聊天机器人模型，并针对 ShareGPT 对话进行了微调。它由 LM-SYS 开发，特别是李大成、郑连民和张昊等人，并于 2023 年 4 月发布。

Q2：FastChat-T5 使用的是哪种架构？
A2：它采用编码器-解码器转换器架构，可以双向处理输入文本并自回归地生成响应。

Q3：FastChat-T5 可以用于商业项目吗？
A3：是的，FastChat-T5 采用 Apache License 2.0 许可，明确允许商业和非商业用途，使其适用于广泛的应用。

Q4：FastChat-T5性能的主要优势和劣势是什么？
A4：它在通用任务、角色扮演、常识判断和反事实任务方面表现出色，通常优于规模更大的模型。然而，它在编程和高等数学等专业领域则存在局限性。

Q5：用户在使用 FastChat-T5 时应注意哪些伦理问题？
A5：用户应注意，该模型可能继承自其ShareGPT训练数据的偏差。因此，负责任地使用该模型至关重要，应监控输出结果是否存在潜在的偏差或有害内容，并实施人工监督。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

一个 API
300多个人工智能模型

节省20%的费用