EmotiVoice 网易开源的中英文 TTS 引擎
2024-9-20 08:0:0 Author: blog.einverne.info(查看原文) 阅读量:6 收藏

EmotiVoice 是网易有道 AI 团队开源的一个强大的 [[TTS]] 引擎,支持中英文双语,包含 2000 多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。上线一周时间便获得了 4000 多星的成绩,并且在 GitHub Trending 榜首。

首先我们来解释一下什么是 TTS,TTS 是 Text-to-Speech 的缩写,就是「文本到语音」的技术,是一种将文本内容转换成语音输出的技术。

功能

  • 中英文双语
  • 2000 多种不同音色
  • 情感合成,语音更有表现力
  • 网页界面,提供了简洁直观的网页界面
  • 批量生成接口,API

pQ5b6MsYk-

EmotiVoice 支持几十种声音选择,支持调节语速,音量,Pitch(音高),还能直接导出 mp3 或者 wav 格式。

音高指的是人耳感知到的声音的高低,人耳对声音频率高低的主观感知。它是声音的三大基本属性之一,与音量(loudness)和音色(timbre)并列。

Pitch 主要由声音的基频决定,基频越高,音高越高。

安装

可以通过官方的站点下载 macOS 的安装包

注意当前仅仅支持 Apple Silicon 芯片 M 系列设备。

如果安装之后打开报错:

“emotivoice” is damaged and can’t be opened. You should move it to the Trash.

那么需要执行如下的命令1

sudo xattr -r -d com.apple.quarantine /Applications/emotivoice.app

然后就可以正常打开 EmotiVoice。


文章来源: https://blog.einverne.info/post/2024/09/emotivoice.html
如有侵权请联系:admin#unsafe.sh