python實現(xiàn)播放音頻和錄音功能示例代碼
音頻預(yù)處理
這一講主要介紹些音頻基本處理方式,為接下來的語音識別打基礎(chǔ)。
三種播放音頻的方式
使用 python 播放音頻有以下幾種方式:
os.system()
os.system(file) 調(diào)用系統(tǒng)應(yīng)用來打開文件,file 可為圖片或者音頻文件。
缺點:要打開具體的應(yīng)用,不能在后臺播放音頻。
pyaudio
安裝:pip install pyaudio
官方提供了播放音頻與錄音的 api ,使用十分方便,只要把Filename更改為你的音頻文件的文字,就可以播放音頻了。
"""PyAudio Example: Play a WAVE file.""" import pyaudio import wave CHUNK = 1024 FILENAME = '你的音頻文件' def play(filename = FILENAME): wf = wave.open(filename, 'rb') p = pyaudio.PyAudio() stream = p.open(format=p.get_format_from_width(wf.getsampwidth()), channels=wf.getnchannels(), rate=wf.getframerate(), output=True) data = wf.readframes(CHUNK) while data != b'': stream.write(data) data = wf.readframes(CHUNK) stream.stop_stream() stream.close() p.terminate()
jupyter notebook
在 jupyer notebook 中播放音頻可以使用以下函數(shù):
import IPython.display as ipd ipd.Audio(文件名)
幾種讀取音頻的方式
python 有很多讀取音頻文件的方法,內(nèi)置的庫 wave ,科學(xué)計算庫 scipy, 和方便易用的語音處理庫 librosa。
下面將介紹分別使用這幾種庫讀取音頻文件:
安裝:
- wave 是內(nèi)置庫直接導(dǎo)入即可。
- scipy: pip install scipy
- librosa: pip install librosa
使用:
wave.open:
參數(shù) path 為文件名,mode 為打開方式
以'rb'方式打開文件返回一個 Wave_read 對象,而以'wb'方式打開文件返回一個 Wave_write 對象。
scipy.io.wavfile:
參數(shù) path 為文件名
返回 rate : 采樣率(每秒采樣點的個數(shù)),data : 音頻數(shù)據(jù)
librosa.load:
參數(shù) path 為文件名
返回 y 為音頻數(shù)據(jù),sr 為采樣率
# read wav file from path from scipy.io import wavfile import librosa import pyaudio # wave file = wave.open(path,'rb') # wavfile rate, data = wavfile.read(path) # librosa y, sr = librosa.load(path)
下面演示一個使用 wavfile 讀取音頻文件并且畫出波形的例子:
首先要計算音頻到底持續(xù)了多長時間,wave 的 shape 就是總的采樣點個數(shù),除以采樣頻率可以得到持續(xù)的總時間(秒),乘1000得到總持續(xù)時間(毫秒)。接著通過 np.linsapce 產(chǎn)生時間的序列,最后使用 matplotlib 畫出圖像。
from scipy.io import wavfile
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline
# 一秒采樣數(shù)
sr, wave = wavfile.read('D://QQPCMgr/Desktop/python3/skip.wav')
sample_number = wave.shape[0]
total_time = int(sample_number / sr * 1000)
time_series = np.linspace(0,total_time,sample_number)
fig, ax = plt.subplots(1, 1)
ax.plot(time_series, wave)
ax.set_title('Time*Amplitude')
ax.set_xlabel('Time/ms')
ax.set_ylabel('Amplitude/dB')

最后再借用 pyaudio 的 api 我們可以實現(xiàn)連續(xù)錄音功能:
python 實現(xiàn)錄音功能
其中,函數(shù) multi_record每結(jié)束一次錄音會詢問 “是否進(jìn)行下一次錄音?”,按回車就可以進(jìn)行下一次錄音了。
import wave
import pyaudio
import matplotlib.pyplot as plt
import time
CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5
def record(filename='output.wav'):
"""官方錄音教程
"""
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
print("* recording")
frames = []
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)
print("* done recording")
stream.stop_stream()
stream.close()
p.terminate()
wf = wave.open(filename, 'wb')
wf.setnchannels(CHANNELS)
wf.setsampwidth(p.get_sample_size(FORMAT))
wf.setframerate(RATE)
wf.writeframes(b''.join(frames))
wf.close()
def multi_record(num=3):
"""implement 多次錄音"""
for i in range(1,num+1):
print('第{}次錄音準(zhǔn)備'.format(i))
filename = 'record_{}.wav'.format(i)
record(filename)
time.sleep(second)
_ = input('進(jìn)行下一次錄音?')
def main():
multi_record()
if __name__ == '__main__':
main()
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。
相關(guān)文章
pycharm配置python環(huán)境的詳細(xì)圖文教程
PyCharm是一款功能強(qiáng)大的Python編輯器,具有跨平臺性,下面這篇文章主要給大家介紹了關(guān)于pycharm配置python環(huán)境的詳細(xì)圖文教程,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下2023-01-01
用python獲取txt文件中關(guān)鍵字的數(shù)量
這篇文章主要介紹了如何用python獲取txt文件中關(guān)鍵字的數(shù)量,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-12-12
了解一下python內(nèi)建模塊collections
這篇文章主要介紹了Python內(nèi)建模塊——collections的相關(guān)資料,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-09-09
Python實現(xiàn)讀取字符串按列分配后按行輸出示例
這篇文章主要介紹了Python實現(xiàn)讀取字符串按列分配后按行輸出,涉及Python針對字符串的遍歷、判斷、運算等相關(guān)操作技巧,需要的朋友可以參考下2018-04-04
使用Selenium控制當(dāng)前已經(jīng)打開的chrome瀏覽器窗口
有時通過selenium打開網(wǎng)站時,發(fā)現(xiàn)有些網(wǎng)站需要掃碼登錄,就很頭疼,導(dǎo)致爬蟲進(jìn)展不下去,下面這篇文章主要給大家介紹了關(guān)于使用Selenium控制當(dāng)前已經(jīng)打開的chrome瀏覽器窗口的相關(guān)資料,需要的朋友可以參考下2022-07-07

