



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'gpt-4o',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="gpt-4o",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Detalhes do produto
✨ GPT-4º: A IA multimodal da próxima geração
GPT-4o, desenvolvido por OpenAIO GPT-4 representa um salto significativo na inteligência artificial, integrando perfeitamente texto, visão e, em breve, recursos de áudio. Lançado em etapas a partir de maio de 2024, este modelo principal é a versão mais recente da série GPT-4, projetada para raciocínio em tempo real e versatilidade incomparável.
💡 Principais destaques do GPT-4o
- Domínio Multimodal: Funcionalidades unificadas para texto, visão e, em breve, suporte para áudio.
- Chamada de função aprimorada e modo JSON: Integração aprimorada para desenvolvedores.
- Visão Avançada: Compreensão e interpretação de imagens superiores.
- Suporte global em idiomas: Desempenho significativamente melhorado para idiomas que não o inglês.
- Econômico e mais rápido: Aumento dos limites de taxa e redução de custos na utilização da API.
Informações básicas
Nome do modelo: GPT-4o
Desenvolvedor/Criador: OpenAI
Data de lançamento: Lançado em etapas a partir de maio de 2024.
Versão: Última versão da série GPT-4
Tipo de modelo: IA multimodal (texto, visão e, em breve, suporte para áudio)
Casos de uso pretendidos
O GPT-4o foi projetado especificamente para desenvolvedores e empresas que desejam integrar IA de ponta em diversas aplicações. Isso inclui chatbots avançados, geração de conteúdo sofisticada e interpretação de dados complexos.
Capacidades de Imagem Médica: Notavelmente, o GPT-4o atinge uma precisão de aproximadamente 90% na interpretação de imagens radiológicas, como raios-X e ressonâncias magnéticas. Saiba mais sobre este e outros modelos de IA em aplicações na área da saúde: Aplicações de IA na área da saúde .
Suporte aprimorado para idiomas: Com a tokenização aprimorada, o GPT-4o oferece suporte robusto a vários idiomas, tornando-o extremamente valioso para implantações globais.
⚙️ Especificações Técnicas
Arquitetura e Treinamento
Arquitetura: Com base na alta eficiência Arquitetura de transformadoresOtimizado para velocidade e integração multimodal perfeita.
Dados de treinamento: Treinado em uma ampla e diversificada gama de textos da internet e dados estruturados.
Nível de conhecimento limite: As informações estão atualizadas até Outubro de 2023.
Fonte e tamanho dos dados: Utiliza um extenso conjunto de dados baseado na internet, cujo tamanho exato não foi divulgado pela OpenAI.
Diversidade e Viés: Rigorosamente treinado em diversos conjuntos de dados para minimizar o viés e garantir robustez em várias faixas demográficas.
🚀 Indicadores de desempenho
Os resultados dos testes divulgados pela própria OpenAI demonstram que o GPT-4o consistentemente alcança pontuações significativamente melhores ou comparáveis quando comparado a outros modelos multimodais de grande porte (LMMs) líderes de mercado. Isso inclui versões anteriores do GPT-4, o Claude 3 Opus da Anthropic, o Gemini do Google e o Llama3 da Meta.

Indicadores-chave de desempenho:
- Precisão: O GPT-4o estabelece novos padrões em tradução de áudio, superando modelos concorrentes da Meta e do Google, bem como o próprio Whisper-v3 da OpenAI.
- Velocidade: Atinge um tempo médio de resposta à entrada de áudio de 232 milissegundos (máximo de 320 ms), comparável à conversa humana. Além disso, é 50% mais econômico no uso da API.
- Robustez: Demonstra capacidade aprimorada para lidar com diversas entradas e manter um desempenho consistente em vários idiomas e modalidades.
Para uma análise mais aprofundada das capacidades inovadoras do GPT-4o, consulte o blog oficial da OpenAI. "ChatGPT-4o. 7 recursos que você pode ter perdido."
🛠️ Uso e Aplicações
Exemplos de código / SDK:
Os desenvolvedores podem integrar o GPT-4o em seus aplicativos usando os SDKs disponíveis. Aqui está um exemplo de como o recurso de autocompletar em um chat pode ser acionado:
import openai client = openai.OpenAI() response = client.chat.completions.create( model="gpt-4o", messages=[ {"role": "system", "content": "Você é um assistente útil."}, {"role": "user", "content": "O que é GPT-4o?"} ] ) print(response.choices[0].message.content) 🎯 Principais casos de uso do GPT-4o
1. OCR com GPT-4o
O GPT-4o se destaca em tarefas de Reconhecimento Óptico de Caracteres (OCR), convertendo imagens em texto com precisão. Ele consegue responder de forma confiável a comandos como "Leia o número de série" ou "Leia o texto da imagem", tornando-o altamente eficaz para a digitalização de informações.
2. Compreensão do Documento
O modelo demonstra um desempenho excelente na extração de detalhes específicos de imagens com muito texto. Por exemplo, ao receber um recibo e ser questionado "Qual foi a taxa paga?" ou um cardápio com a pergunta "Qual o preço do prato no Restaurante Ham?", o GPT-4o fornece respostas precisas de forma consistente.
3. Aplicações de Visão Computacional em Tempo Real
Aproveitando sua velocidade aprimorada e recursos integrados de áudio e vídeo, o GPT-4o possibilita poderosas aplicações de visão computacional em tempo real. A interação com dados visuais ao vivo permite a coleta rápida de informações e a tomada de decisões cruciais para tarefas como navegação, tradução, assistência guiada e análise complexa de informações visuais.
4. Transformação do Suporte ao Cliente
O GPT-4o revoluciona o atendimento ao cliente, possibilitando um suporte mais preciso, empático e personalizado 24 horas por dia, 7 dias por semana, por meio de chatbots baseados em inteligência artificial. Ele transforma fundamentalmente a maneira como as empresas interagem com seus clientes, melhorando a satisfação e a eficiência.
⚖️ Informações sobre licenciamento
- O licenciamento comercial está disponível. Para obter informações específicas, entre em contato diretamente com [inserir contato aqui]. OpenAI.
❓ Perguntas frequentes (FAQ)
Q1: Qual é a principal capacidade do GPT-40?
A1: O GPT-4o é um modelo de IA multimodal que integra texto, visão e, em breve, suporte a áudio, permitindo o raciocínio em tempo real entre essas modalidades.
P2: Como o GPT-4o se compara aos modelos anteriores em termos de velocidade e custo?
A2: O GPT-4o apresenta um tempo médio de reação à entrada de áudio de 232 milissegundos, comparável à resposta humana. Além disso, é 50% mais econômico no uso da API em comparação com as versões anteriores, ao mesmo tempo que iguala o desempenho do GPT-4 Turbo em texto e código em inglês.
P3: O GPT-4o pode ser usado para aplicações médicas?
A3: Sim, o GPT-4o demonstra alta precisão (aproximadamente 90%) na interpretação de imagens radiológicas, como raios-X e ressonâncias magnéticas, tornando-se uma ferramenta poderosa para aplicações de imagens médicas.
Q4: Quais são algumas das principais aplicações empresariais para o GPT-4o?
A4: O GPT-4o é ideal para suporte ao cliente (chatbots), compreensão de documentos, visão computacional em tempo real (por exemplo, navegação, assistência guiada) e geração avançada de conteúdo.
Q5: Qual é a data limite de conhecimento do GPT-4o?
A5: O conhecimento do GPT-4o está atualizado até outubro de 2023.
Playground de IA



Conecte-se