AI Summary
DeepSeek-V4 Preview é uma nova série de modelos de linguagem MoE altamente eficientes, apresentando o V4-Pro (1,6T de parâmetros) e o V4-Flash (284B de parâmetros). Ambos os modelos suportam uma janela de contexto de 1 milhão de tokens por padrão, utilizando uma nova arquitetura de atenção híbrida para reduzir drasticamente os custos de computação e memória.
No comments yet
Be the first to share your thoughts and start the conversation!