Pular para o conteúdo principal
CÓDIGOSINTÉTICO
Tag

#benchmarks

2 publicações

O que significam os benchmarks de IA que aparecem a cada lançamento de LLM

Um guia direto sobre as siglas MMLU, GPQA, HumanEval, SWE-bench e outros benchmarks que aparecem quando um novo modelo de IA é lançado.

CSCódigo Sintético
08 de mar. de 2026·12 min

GPT-5.4 chega com computer use nativo e janela de 1M tokens

OpenAI lançou o GPT-5.4 com uso nativo de computador, contexto de 1M tokens e 75% no OSWorld, superando a média humana em navegação desktop.

CSCódigo Sintético
08 de mar. de 2026·6 min