Meta 发布了多模 AI 模型 SeamlessM4T,可用于翻译文本和音频,支持最多 100 种语言的文本到语音、语音到文本、语音到语音以及文本到文本的翻译。和 Meta 发布的其它 AI 模型类似,SeamlessM4T 采用 CC BY-NC 4.0 授权,商业使用受限,但允许开发者相对自由的在 SeamlessM4T 基础上进行开发。Meta 还发布了多模翻译数据集 SeamlessAlign,包含 270,000 小时的语音和文本对齐。SeamlessM4T 的文本翻译功能支持近 100 种语言,语音输出功能支持 36 种语言。
https://about.fb.com/news/2023/08/seamlessm4t-ai-translation-model/