top of page
  • Foto do escritorHerman Bessler

GPT 01 (Strawberry): insights, dicas, testes e impressões preliminares

Recentemente, explorei o novo modelo da OpenAI, conhecido como GPT 01 (strawberry). Ele tem a capacidade de "raciocinar" balanceando estratégias de análise e argumentos, o que gera respostas mais complexas em geral.


É indubitável que representa um avanço significativo no mundo da IA Gen, aproximando-se do raciocínio em nível humano em algumas áreas (calma! não é AGI). É como se ele diferenciasse o melhor da base de dados e não a média - não me matem pessoas técnicas pela definição imprecisa.


GPT 01 (Strawberry): insights, dicas, testes e impressões preliminares
Créditos: openai.com

Principais insights


  • Nova Estrutura, Novo Paradigma: O GPT 01 introduz um nível de raciocínio mais avançado, superando modelos anteriores em benchmarks específicos e demonstrando capacidades impressionantes.


  • Desempenho Imprevisível: Ainda é desafiador prever em quais domínios o modelo terá um desempenho excelente, tornando a avaliação de suas limitações uma tarefa contínua. Você vai ter que continuar escolhendo o Claude pra alguns tipos de programação e análise de dados, o Gemini pra trabalhar com livros grandes inteiros, o GPT4o pra tarefas mundanas.


  • Melhorias em Benchmarks: O modelo superou a média de especialistas humanos em testes como o GPQA e MMLU, e alcançou altas pontuações na Olimpíada Internacional de Informática. Em resumo ele é do cacete em tarefas analíticas complexas


  • Limitações em Tarefas Subjetivas: Em tarefas sem respostas claras ou que dependem de nuances, como escrita criativa ou edição de texto, o desempenho do GPT 01 é menos consistente que o 4o


  • Segurança e Transparência: Os passos de raciocínio fornecidos pelo modelo nem sempre refletem fielmente seus processos internos, levantando preocupações sobre a fidelidade e confiabilidade das respostas.


  • Melhorias Multilíngues: O GPT 01 mostrou avanços significativos em idiomas além do inglês, ampliando seu potencial de aplicação global em temas específicos. 


Dicas para testes e uso


  • Foque em Tarefas Objetivas e analíticas: Para aproveitar ao máximo o GPT 01, concentre-se em tarefas com respostas claras e binárias, onde o modelo demonstra maior precisão.


  • Valide Respostas Subjetivas: Em áreas que envolvem julgamento humano ou criatividade, é importante revisar e validar as respostas fornecidas pelo modelo.


  • Explore Recursos Multilíngues: Aproveite as melhorias em outros idiomas para aplicações internacionais ou em contextos multilíngues.


  • Mudanças em prompting: Faça prompts estruturados porém diretos, evite chain-of-tought, não funciona direito. 


  • Ferramentas disponíveis: Ele ainda não possui todas as ferramentas disponíveis no 4o como o web-browsing. 


O GPT 01 (strawberry) é um avanço promissor na IA, mas ainda existem desafios, especialmente em tarefas que exigem nuances e julgamento subjetivo. Lembre-se de que é um modelo preview que vai escalar provavelmente ainda este ano. Estou ansioso para ver como o GPT 01 continuará a evoluir nos próximos meses. 

Comments


Assine a newsletter para receber nossa curadoria de conteúdo toda última terça do mês

Blog.

bottom of page