AI Summary
Apresentamos o M2.5, um modelo de fronteira de código aberto projetado para produtividade no mundo real. Desempenho SOTA em programação (SWE-Bench Verificado 80,2%), busca (BrowseComp 76,3%), uso de ferramentas agentivas (BFCL 76,8%) e trabalho de escritório. Otimizado para execução eficiente, 37% mais rápido em tarefas complexas. A US$1 por hora com 100 tps, o escalonamento infinito de agentes de longo prazo agora é economicamente possível.
No comments yet
Be the first to share your thoughts and start the conversation!