Modelos de raciocínio

Introdução aos recursos

Modelos de raciocínio são modelos de linguagem avançados otimizados para resolução de problemas complexos e tarefas de raciocínio, melhorando a precisão na resolução de problemas ao gerar etapas detalhadas de raciocínio (cadeia de pensamento).

Cenários típicos de aplicação

Resolução de problemas complexos: adequado para cenários que exigem derivação passo a passo e etapas lógicas claras, como matemática e raciocínio científico.
Sistemas de apoio à decisão: fornece processos de raciocínio detalhados para apoiar análises de decisão, ajudando a compreender a lógica por trás das decisões.
Educação e treinamento: ajuda os usuários a aprender e entender conhecimentos complexos, fornecendo processos de derivação detalhados.

Instalação e preparação

Antes de usar modelos de raciocínio, certifique-se de ter instalado a versão mais recente do OpenAI SDK:

pip install -U openai

Como chamar a API

Use modelos de raciocínio chamando a interface /chat/completions.

Descrição dos parâmetros da requisição

max_tokens: define o número máximo de tokens na saída do modelo.
temperature: recomenda-se definir entre 0.5 e 0.7 (recomendado 0.6) para equilibrar criatividade e lógica na saída.
top_p: recomenda-se definir como 0.95.

Exemplo de código de requisição

Requisição com saída em streaming

from openai import OpenAI

client = OpenAI(api_key="YOUR_API_KEY", base_url="https://api.highwayapi.ai/openai")
messages = [
    {"role": "user", "content": "Explique a segunda lei de Newton."}
]

response = client.chat.completions.create(
    model="deepseek/deepseek-r1",
    messages=messages,
    stream=True,
    max_tokens=4096
)

content = ""
reasoning_content = ""
for chunk in response:
    if chunk.choices[0].delta.content:
        content += chunk.choices[0].delta.content
    if chunk.choices[0].delta.reasoning_content:
        reasoning_content += chunk.choices[0].delta.reasoning_content

print("Resposta final:", content)
print("Processo de raciocínio:", reasoning_content)

Requisição com saída não streaming

response = client.chat.completions.create(
    model="deepseek/deepseek-r1",
    messages=[
        {"role": "user", "content": "O que é o efeito estufa? Como reduzi-lo?"}
    ],
    stream=False,
    max_tokens=4096
)

content = response.choices[0].message.content
reasoning_content = response.choices[0].message.reasoning_content

print("Resposta final:", content)
print("Processo de raciocínio:", reasoning_content)

Gerenciamento de contexto

O conteúdo de raciocínio retornado pelo modelo não será anexado automaticamente à próxima rodada da conversa; o usuário precisa gerenciar manualmente o histórico da conversa:

messages.append({"role": "assistant", "content": content})
messages.append({"role": "user", "content": "Continue explicando a solução."})

Lista de modelos compatíveis

Forma de cobrança

A cobrança é feita com base no número de tokens de entrada e saída.
Para padrões específicos de cobrança e regras de conversão, consulte a página de detalhes do modelo.

Observações e melhores práticas

Não adicione instruções de raciocínio à mensagem system; as instruções devem ser explicitadas diretamente na mensagem user.
Em problemas matemáticos, especifique claramente os requisitos, por exemplo: “Raciocine passo a passo e indique claramente a resposta final.”
Para evitar que o modelo pule a etapa de raciocínio, recomenda-se forçar o modelo a adicionar uma quebra de linha antes da saída.

Introdução

API de LLM

Provedores de modelos

Recursos do modelo

Configuração de ferramentas de terceiros

Introdução aos recursos

Cenários típicos de aplicação

Instalação e preparação

Como chamar a API

Descrição dos parâmetros da requisição

Exemplo de código de requisição

Requisição com saída em streaming

Requisição com saída não streaming

Gerenciamento de contexto

Lista de modelos compatíveis

Forma de cobrança

Observações e melhores práticas

​Introdução aos recursos

​Cenários típicos de aplicação

​Instalação e preparação

​Como chamar a API

​Descrição dos parâmetros da requisição

​Exemplo de código de requisição

​Requisição com saída em streaming

​Requisição com saída não streaming

​Gerenciamento de contexto

​Lista de modelos compatíveis

​Forma de cobrança

​Observações e melhores práticas

Introdução aos recursos

Cenários típicos de aplicação

Instalação e preparação

Como chamar a API

Descrição dos parâmetros da requisição

Exemplo de código de requisição

Requisição com saída em streaming

Requisição com saída não streaming

Gerenciamento de contexto

Lista de modelos compatíveis

Forma de cobrança

Observações e melhores práticas