Olmo Hybrid - AI Radar

About Olmo Hybrid

Modelo aberto de 7B misturando transformers e RNNs lineares

AI Summary

Olmo Hybrid é um modelo 7B totalmente aberto que combina atenção transformer com camadas RNN lineares. Utilizando um padrão 3:1 de Gated DeltaNet para atenção, ele iguala a precisão do Olmo 3 no MMLU enquanto usa 49% menos tokens.

Detailed Description

Olmo Hybrid: modelo de IA 🤖 aberto de 7B que une a atenção transformer com RNNs lineares. Usa DeltaNet para otimizar, atingindo a precisão do Olmo 3 no MMLU com 49% menos tokens! 🚀 Ideal para tarefas de linguagem com eficiência e precisão. ✨

Key Features

Modelo 7B totalmente aberto
Combina atenção transformer com camadas RNN lineares
Utiliza um padrão 3:1 de Gated DeltaNet para atenção
Atinge a mesma precisão do Olmo 3 no MMLU
Utiliza 49% menos tokens

Videos

4
Comments 0

No comments yet

Be the first to share your thoughts and start the conversation!

Join the conversation

Sign in to leave a comment and share your thoughts.

0.0
0 reviews
Loading...
Loading rating distribution...
Loading...

Loading reviews...