AI Summary
TADA (Alinhamento Dual Texto-Acústico) é o modelo de fala-linguagem de código aberto da Hume AI que sincroniza texto e áudio um-para-um. TADA sincroniza texto e fala em um único fluxo contínuo via alinhamento token-a-token 1:1. Gerar áudio a 5x a velocidade dos sistemas TTS convencionais baseados em LLM elimina completamente palavras puladas e alucinações de conteúdo em mais de 1000 testes.
No comments yet
Be the first to share your thoughts and start the conversation!