EmotiVoice 是网易有道 AI 团队开源的一个强大的 [[TTS]] 引擎,支持中英文双语,包含 2000 多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。上线一周时间便获得了 4000 多星的成绩,并且在 GitHub Trending 榜首。
首先我们来解释一下什么是 TTS,TTS 是 Text-to-Speech 的缩写,就是「文本到语音」的技术,是一种将文本内容转换成语音输出的技术。
功能
- 中英文双语
- 2000 多种不同音色
- 情感合成,语音更有表现力
- 网页界面,提供了简洁直观的网页界面
- 批量生成接口,API
EmotiVoice 支持几十种声音选择,支持调节语速,音量,Pitch(音高),还能直接导出 mp3 或者 wav 格式。
音高指的是人耳感知到的声音的高低,人耳对声音频率高低的主观感知。它是声音的三大基本属性之一,与音量(loudness)和音色(timbre)并列。
Pitch 主要由声音的基频决定,基频越高,音高越高。
安装
可以通过官方的站点下载 macOS 的安装包。
注意当前仅仅支持 Apple Silicon 芯片 M 系列设备。
如果安装之后打开报错:
“emotivoice” is damaged and can’t be opened. You should move it to the Trash.
那么需要执行如下的命令1
sudo xattr -r -d com.apple.quarantine /Applications/emotivoice.app
然后就可以正常打开 EmotiVoice。