Pular para o conteúdo principal

Sugestão de Modelos de LLM

1. Modelos OpenAI

GPT-4.1, GPT-4.1 mini, GPT-4.1 nano

  • Principais características:

    • Excelente para seguir instruções e fazer chamadas de ferramentas.
    • Janela de contexto de 1 milhão de tokens (lida com entradas enormes).
    • Baixa latência, sem etapa explícita de raciocínio.
  • Diferenças:

    • Mini e Nano são versões mais leves, rápidas e econômicas, mas podem apresentar desempenho um pouco inferior em relação à versão completa.
  • Exemplos de uso:

    • GPT-4.1: indicado para tarefas complexas que exigem alta precisão e grande contexto, como análise de documentos longos ou geração avançada de código.
    • Mini/Nano: ideais para tarefas rápidas e sensíveis a custo, onde uma leve redução na precisão é aceitável, como chatbots, snippets de código e processamento em lote.

GPT-4o, GPT-4o mini

  • Principais características:

  • O GPT-4o é o modelo “omni” mais recente, otimizado para chat e integrações via API.

    • A versão Mini é menor, mais rápida e eficiente para tarefas de código e visuais.
    • Ambas suportam entradas de texto e imagem (multimodal).
  • Exemplos de uso:

    • GPT-4o: para aplicações de chat, agentes conversacionais e quando você deseja testar as últimas melhorias.
    • GPT-4o mini: para tarefas rápidas e acessíveis, como revisão de código, extração visual de dados ou quando há muitas requisições paralelas.

GPT-5, GPT-5 mini, GPT-5 nano

  • Principais características:

    • O GPT-5 é o principal modelo para tarefas de codificação, raciocínio e agentes

      • Mini e Nano são otimizados para velocidade e custo, sendo o Nano o mais rápido e econômico.
    • Exemplos de uso:

      • GPT-5: para codificação avançada, raciocínio em múltiplas etapas e fluxos de trabalho com agentes, como construção de agentes autônomos e análise de dados complexos.
      • Mini: para tarefas bem definidas e precisas em que a velocidade é importante; por exemplo: testes automatizados e extração estruturada de dados.
      • Nano: para tarefas simples e de alto volume, como sumarização, classificação ou quando o custo é a principal preocupação.

GPT o3 mini, GPT o4 mini

  • Principais características:

  • Modelos pequenos e rápidos para raciocínio e geração de saídas estruturadas.

    • Suportam chamadas de função e API em lote.
  • Exemplos de uso:

    • Para aplicações leves, geração de dados estruturados ou quando você precisa processar muitos pedidos de forma rápida e econômica.

Para mais detalhes, confira a documentação da OpenAI.

2. Modelos Anthropic Claude (via Bedrock)

Claude 3.5 Sonnet

  • Principais características:

    • Excelente em raciocínio passo a passo, cuidadoso ao lidar com temas controversos.

3.7 Sonnet

Conversacional e cuidadoso, o 3.7 é mais proativo em diálogos.

4 Sonnet

É destaque em tarefas complexas e de longa duração, tanto em codificação quanto em agentes. É o melhor para fluxos avançados de código e agentes.

  • Exemplos de uso:

    • 3.5/3.7: para conversas reflexivas e com nuances, moderação de conteúdo ou ao tratar de temas sensíveis.

    • 4 Sonnet: para codificação complexa, tarefas longas ou quando é necessário desempenho consistente em fluxos de agentes.

Para mais detalhes, confira a documentação da Anthropic.

3. DeepSeek R1 (via Bedrock)

  • Principais características: código aberto, excelente em inferência lógica, matemática e tomada de decisão em tempo real.

  • Exemplo de uso: para tarefas que exigem resolução de problemas matemáticos, desafios de lógica ou quando você busca uma alternativa open source.

Para mais detalhes, confira a documentação do DeepSeek.

4. Llama 4 Models

Llama 4 Maverick, Llama 4 Scout (via Bedrock)

  • Principais características:

  • Multimodal (texto, imagem), multilíngue, otimizado para programação e execução de ferramentas

  • Scout é uma variante menor e se destaca em sumarização, análise e interpretação de imagens.

  • Exemplos de como você pode usar:

    • Maverick: para sistemas com agentes autônomos, aplicações multilíngues e tarefas multimodais.
    • Scout: para resumir grandes documentos, analisar atividades de usuários ou responder perguntas visuais.

Para mais detalhes, confira a documentação do DeepSeek.

5. Mistral Pixtral (via Bedrock)

  • Principais características:

    • Multimodal, destaca-se na compreensão de documentos, gráficos e imagens.
  • Exemplos de como você pode usar:

    • Para extrair informações de imagens, analisar gráficos ou quando você precisa de uma compreensão avançada de texto e imagem.

Para mais detalhes, confira a documentação da Mistral AI.

6. Gemini 2.5 Pro

  • Principais características:

    • Modelo multimodal de última geração (suporta áudio, imagem, vídeo e texto como entrada);
    • Ideal para tarefas complexas de codificação, raciocínio e compreensão multimodal.
  • Exemplos de como você pode usar:

    • Para análise avançada de dados, manipulação de múltiplos tipos de entrada ou quando você precisa da mais alta precisão em tarefas complexas.

Para mais detalhes, confira a documentação do Gemini.

Dica!

Como escolher a LLM ideal? Confira a seguir algumas dicas rápidas:

  • Precisa de alta precisão e contexto amplo? Use GPT-4.1 ou GPT-5.
  • Precisa de rapidez e baixo custo? Use versões mini ou nano.
  • Precisa de suporte multimodal (imagem)? Use GPT-4o, Llama 4, Mistral Pixtral, ou Gemini 2.5 Pro.
  • Precisa de open source? Use DeepSeek R1.
  • Precisa de conversas cuidadosas e detalhadas? Use modelos Claude.