Meta 的基础人工智能研究 (FAIR) 团队推出了Omnilingual ASR——一套突破性的模型套件,可为超过 1600 种语言提供自动语音识别,其中包括 500 种此前从未被 AI 转录过的低资源语言。
还开源了 Omnilingual wav2vec 2.0,这是一个全新的自监督式大规模多语言语音表示模型,其参数量高达 70 亿,可用于其他下游语音相关任务。
Meta | GitHub
via 君宇 方
🍀在花频道 🍵茶馆 📮投稿新鲜事
👍 99 🤣 9 ❤️ 3 😁 2 🤨 2
1