AI Summary
A cada turno do agente, você está reenviando o contexto completo. De novo. Essa sobrecarga se acumula rapidamente. O Modo WebSocket para a API de Respostas mantém uma conexão persistente, envia apenas entradas incrementais e reduz a latência de ponta a ponta em até 40% em fluxos de trabalho pesados com chamadas de ferramentas.
No comments yet
Be the first to share your thoughts and start the conversation!