Pular para o conteúdo principal

Introdução aos recursos

Modelos de raciocínio são modelos de linguagem avançados otimizados para resolução de problemas complexos e tarefas de raciocínio, melhorando a precisão na resolução de problemas ao gerar etapas detalhadas de raciocínio (cadeia de pensamento).

Cenários típicos de aplicação

  • Resolução de problemas complexos: adequado para cenários que exigem derivação passo a passo e etapas lógicas claras, como matemática e raciocínio científico.
  • Sistemas de apoio à decisão: fornece processos de raciocínio detalhados para apoiar análises de decisão, ajudando a compreender a lógica por trás das decisões.
  • Educação e treinamento: ajuda os usuários a aprender e entender conhecimentos complexos, fornecendo processos de derivação detalhados.

Instalação e preparação

Antes de usar modelos de raciocínio, certifique-se de ter instalado a versão mais recente do OpenAI SDK:
pip install -U openai

Como chamar a API

Use modelos de raciocínio chamando a interface /chat/completions.

Descrição dos parâmetros da requisição

  • max_tokens: define o número máximo de tokens na saída do modelo.
  • temperature: recomenda-se definir entre 0.5 e 0.7 (recomendado 0.6) para equilibrar criatividade e lógica na saída.
  • top_p: recomenda-se definir como 0.95.

Exemplo de código de requisição

Requisição com saída em streaming

from openai import OpenAI

client = OpenAI(api_key="YOUR_API_KEY", base_url="https://api.highwayapi.ai/openai")
messages = [
    {"role": "user", "content": "Explique a segunda lei de Newton."}
]

response = client.chat.completions.create(
    model="deepseek/deepseek-r1",
    messages=messages,
    stream=True,
    max_tokens=4096
)

content = ""
reasoning_content = ""
for chunk in response:
    if chunk.choices[0].delta.content:
        content += chunk.choices[0].delta.content
    if chunk.choices[0].delta.reasoning_content:
        reasoning_content += chunk.choices[0].delta.reasoning_content

print("Resposta final:", content)
print("Processo de raciocínio:", reasoning_content)

Requisição com saída não streaming

response = client.chat.completions.create(
    model="deepseek/deepseek-r1",
    messages=[
        {"role": "user", "content": "O que é o efeito estufa? Como reduzi-lo?"}
    ],
    stream=False,
    max_tokens=4096
)

content = response.choices[0].message.content
reasoning_content = response.choices[0].message.reasoning_content

print("Resposta final:", content)
print("Processo de raciocínio:", reasoning_content)

Gerenciamento de contexto

O conteúdo de raciocínio retornado pelo modelo não será anexado automaticamente à próxima rodada da conversa; o usuário precisa gerenciar manualmente o histórico da conversa:
messages.append({"role": "assistant", "content": content})
messages.append({"role": "user", "content": "Continue explicando a solução."})

Lista de modelos compatíveis

Forma de cobrança

  • A cobrança é feita com base no número de tokens de entrada e saída.
  • Para padrões específicos de cobrança e regras de conversão, consulte a página de detalhes do modelo.

Observações e melhores práticas

  • Não adicione instruções de raciocínio à mensagem system; as instruções devem ser explicitadas diretamente na mensagem user.
  • Em problemas matemáticos, especifique claramente os requisitos, por exemplo: “Raciocine passo a passo e indique claramente a resposta final.”
  • Para evitar que o modelo pule a etapa de raciocínio, recomenda-se forçar o modelo a adicionar uma quebra de linha antes da saída.