Ollama v0.19 reconstrói a inferência em Apple Silicon com base no MLX, trazendo um desempenho local muito mais rápido para fluxos de trabalho de codificação e agentes. Também adiciona suporte a NVFP4 e reutilização de cache mais inteligente, snapshots e remoção para sessões mais responsivas.
Detailed Description
Ollama v0.19: 🚀 IA local turbinada! Performance ultra-rápida em Apple Silicon com MLX, ideal para codificação e agentes. 💻 NVFP4 e cache inteligente 🧠 para sessões responsivas. Snapshots e descarte otimizado. ⚡️
Tool Screenshot
Click to enlarge
Key Features
Reconstrução da inferência Apple Silicon sobre MLX para maior velocidade local.
Desempenho aprimorado para fluxos de trabalho de codificação e agentes.
No comments yet
Be the first to share your thoughts and start the conversation!