AI Summary
Mistral 3 inclui três modelos pequenos e densos de última geração (14B, 8B e 3B) e o Mistral Large 3 – nosso modelo mais capaz até o momento – uma mistura esparsa de especialistas treinada com 41B de parâmetros ativos e 675B de parâmetros totais. Todos os modelos são lançados sob a licença Apache 2.0. Os modelos Ministral representam a melhor relação desempenho-custo em sua categoria. Ao mesmo tempo, o Mistral Large 3 se junta às fileiras de modelos de código aberto de ponta, ajustados para instruções.
No comments yet
Be the first to share your thoughts and start the conversation!