python
的语音处理模块。
参考资料
gtts模块
这是一款语音模块,它可以将任意文字转换为音频文件,格式为 mp3
。下面我们一起来看看它的用法:
安装并导入
1 | pip install gtts |
配置gtts客户端
1 | tts = gTTS(text=text, lang='zh-tw') |
保存音频文件
1 | tts.save("XXX.mp3") |
baidu-aip
通过在百度开放开发者平台申请语音合成账号来生成音频文件。
1 | # 下载baidu-aip模块并导入 |
pyttsx3
这也是一款优秀的文字转语音的模块,它生成的音频文件也比较具有个性化。
下载pyttsx3模块并导入
1 | pip install pyttsx3 |
初始化
1 | pp = pyttsx3.init() |
添加语音文本
1 | pp.say('Hello World') |
运行
1 | pp.runAndWait() |
当然它还可以调整声音的音量,频率,变声,当然设置方法都差不多,都是先拿到它对应功能的值然后在进行加减。
比如说音量调节
1 | vol=pp.getProperty('volume') |
对于发音,频率,变声则为 vioce
,rate
,vioces
,是不是很好理解了?当然,如果你想让它循环播放,只需加一个事件驱动循环即可:
1 | pp.startLoop() |
pywin32
操作window dll的库,它可以实现很多功能,十分强大。
安装并且导入:
1 | pip install pywin32 |
配置客户端接口:
1 | speaker = win32com.client.Dispatch("SAPI.SpVoice") |
生成音频:
1 | speaker.Speak("hello") |
由于对中文支持不友好,所以基本用的不多。
speech
也是一款强大的语音模块,依赖于pywin32,而且它最适合做语音启动程序了。
下载并导入
1 | pip install speech |
生成音频
1 | speech.say('hello') |