当前位置:主页 > python教程 > 使用Python实现文字转语音并生成wav文件的例子

Python实现文字转语音并生成wav文件的实例代码

发布:2019-12-19 14:23:16 196


我们帮大家精选了Python实例相关的编程文章,网友宫阳霁根据主题投稿了本篇教程内容,涉及到Python、文字、语音、wav文件、使用Python实现文字转语音并生成wav文件的例子相关内容,已被929网友关注,下面的电子资料对本篇知识点有更加详尽的解释。

使用Python实现文字转语音并生成wav文件的例子

目前手边的一些工作,需要实现声音播放功能,而且仅支持wav声音格式。

现在,一些网站上支持文字转语音功能,但是生成的都是MP3文件,这样还需要额外的软件来转成wav文件,十分麻烦。

后来,研究Python,发现Python可以很容易的实现上面的功能。

步骤如下,

1。使用百度语音实现TTS(Text To Speech),生成mp3文件;

2。 使用pydub和ffmpeg实现mp3转wav格式。

下面,先上简单的示例代码,然后对代码作简单的分析。

#!/usr/bin/python -tt
# -*- coding: utf-8 -*-
from aip import AipSpeech
from pydub import AudioSegment
 
# Step 1, Using baidu AI to generate mp3 file from text
#input your APP_ID/API_KEY/SECRET_KEY
APP_ID = 'Your_APP_ID' 
API_KEY = 'Your_API_KEY' 
SECRET_KEY = 'Your_Secret_Key' 
 
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) 
result = client.synthesis('你好百度, good morning', 'zh', 1, { 'vol': 5,'per':4 }) 
 
if not isinstance(result, dict): 
 with open('test.mp3', 'wb') as f: 
  f.write(result)
 
# Step 2, convert the mp3 file to wav file
sound = AudioSegment.from_mp3('test.mp3')
sound.export("test.wav", format="wav")

运行上面的python代码,就会生成test.mp3和test.wav,使用命令“aplay test.wav”,可以测试播放声音。

下面对代码做解析,

1。在运行之前,需要安装下面的库,

1.1 安装百度AI模块,安装命令“pip install baidu-aip”

1.2 安装pydub,pydub是python的一个音频处理库处理,能对wav格式的音频直接进行处理,安装命令“pip install pydub”

1.3 安装ffmpeg,可以实现对mp3格式的处理,安装命令“sudo apt-get install ffmpeg”

2。需要注册百度的应用开发者账户,

用户可以自行去下面的网站去注册语音合成-百度AI​ai.baidu.com,注册百度云之后,去控制台创建应用,过程比较简单。

大家可以对上述代码进行进一步的优化,以实现自己想要的功能。

下面是完整的Python代码,大家可以拿来使用,

#!/usr/bin/python -tt
# -*- coding: utf-8 -*-
"""
 module: baiduVoiceGenerate
 platform: Linux
 description: Generate Speech from Text, and convert the audio to wav file.
 Precondition: Please install below module before run this progrom,
     1. pip install baidu-aip
     2. pip install pydub
     3. sudo apt-get install ffmpeg
 creater: Guangwei Jiang
 create time: 2018-11-21
"""
from aip import AipSpeech
from pydub import AudioSegment
import time
 
#input your own APP_ID/API_KEY/SECRET_KEY
APP_ID = '14891501' 
API_KEY = 'EIm2iXtvDSplvR5cyHU8dAeM' 
SECRET_KEY = '4KkGGzTq2GVrBEYPLXXWEEIoyLL1F6Zt ' 
 
print("baiduVoiceGenerate: V1.0, by Guanagwei_Jiang, 20181121")
str = raw_input("请输入要转成语音的文字: ")
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) 
result = client.synthesis(str, 'zh', 1, { 'vol': 5,'per':4 }) 
 
if not isinstance(result, dict): 
 with open('temp.mp3', 'wb') as f: 
  f.write(result)
 
sound = AudioSegment.from_mp3('temp.mp3')
sound.export(time.strftime("%Y%m%d_%H%M%S", time.localtime())+".wav", format="wav")

以上这篇使用Python实现文字转语音并生成wav文件的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。


参考资料

相关文章

  • Python中列出目录中的文件的五种方法小结

    发布:2023-03-23

    本文主要介绍了Python中列出目录中的文件的五种方法小结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧


  • python爬取内容存入Excel实例

    python爬取内容存入Excel实例

    发布:2022-12-06

    给大家整理一篇关于python 爬的教程,这篇文章主要为大家详细介绍了python爬取内容存入Excel实例,具有一定的参考价值,感兴趣的小伙伴们可以参考一下


  • Python如何利用TCP实现会聊天的小机器人

    发布:2020-01-27

    这篇文章主要介绍了Python基于TCP实现会聊天的小机器人功能,结合实例形式分析了Python通过socket模块实现TCP连接的客户端与服务器端模拟聊天机器人功能相关操作技巧,需要的朋友可以参考下


  • 如何使用python识别色情图片

    发布:2020-03-06

    这篇文章主要介绍了python好玩的项目—色情图片识别,具有一定参考价值,需要的朋友可以了解下。


  • Python优化算法之遗传算法案例代码

    发布:2023-04-06

    优化算法,尤其是启发式的仿生智能算法在最近很火,它适用于解决管理学,运筹学,统计学里面的一些优化问题,这篇文章主要介绍了Python优化算法—遗传算法,需要的朋友可以参考下


  • Python读取excel中的图片完美解决方法

    Python读取excel中的图片完美解决方法

    发布:2022-09-07

    给网友朋友们带来一篇关于Python excel的教程,excel中的图片非常常见,但是通过python读取excel中的图片没有很好的解决办法。今天小编给大家分享一种比较聪明的方法,感兴趣的朋友跟随脚本之家小编看看吧


  • Python中的Networkx的基本使用

    发布:2023-04-10

    Networkx是一个Python的包,可以用来创建和处理复杂的图网络结构,这篇文章主要介绍了Python中的Networkx详解,需要的朋友可以参考下


  • Python面向对象类编写细节分析(类,方法,继承,超类,接口)

    发布:2019-06-11

    这篇文章主要介绍了Python面向对象类编写细节,较为详细的分析了Python面向对象程序设计中类,方法,继承,超类,接口等相关概念、使用技巧与注意事项,需要的朋友可以参考下


网友讨论