Python 讀取WAV音頻文件 畫頻譜的實(shí)例
Python 讀取WAV文件
import wave
import struct
from scipy import *
from pylab import *
#讀取wav文件,我這兒讀了個(gè)自己用python寫的音階的wav
filename = '1.wav'
wavefile = wave.open(filename, 'r') # open for writing
#讀取wav文件的四種信息的函數(shù)。期中numframes表示一共讀取了幾個(gè)frames,在后面要用到滴。
nchannels = wavefile.getnchannels()
sample_width = wavefile.getsampwidth()
framerate = wavefile.getframerate()
numframes = wavefile.getnframes()
print("channel",nchannels)
print("sample_width",sample_width)
print("framerate",framerate)
print("numframes",numframes)
#建一個(gè)y的數(shù)列,用來保存后面讀的每個(gè)frame的amplitude。
y = zeros(numframes)
#for循環(huán),readframe(1)每次讀一個(gè)frame,取其前兩位,是左聲道的信息。右聲道就是后兩位啦。
#unpack是struct里的一個(gè)函數(shù),用法詳見http://docs.python.org/library/struct.html。簡(jiǎn)單說來就是把#packed的string轉(zhuǎn)換成原來的數(shù)據(jù),無論是什么樣的數(shù)據(jù)都返回一個(gè)tuple。這里返回的是長(zhǎng)度為一的一個(gè)
#tuple,所以我們?nèi)∷牡诹阄弧?
for i in range(numframes):
val = wavefile.readframes(1)
left = val[0:2]
#right = val[2:4]
v = struct.unpack('h', left )[0]
y[i] = v
#framerate就是44100,文件初讀取的值。然后本程序最關(guān)鍵的一步!specgram!實(shí)在太簡(jiǎn)單了。。。
Fs = framerate
specgram(y, NFFT=1024, Fs=Fs, noverlap=900)
show()
補(bǔ)充知識(shí):matlab生成wav文件并用python驗(yàn)證
在進(jìn)行頻譜分析時(shí),發(fā)現(xiàn)MATLAB和python讀取wav文件的波形不一致,導(dǎo)致不能得出正確結(jié)果,為了驗(yàn)證MATLAB和python哪部分有問題,于是有了這篇博客。
1、需求分析
用MATLAB生成一個(gè)正弦波并保存為wav文件,然后用python讀取這個(gè)wav文件畫出波形,查看python讀取出來的波形和matlab生成的波形是否一致。
2、代碼實(shí)現(xiàn)
2.1 MATLAB生成wav文件
Df=5; %頻率間隔
fs = 8000; %采樣頻率
T = 1/fs; %采樣周期
N=fs/Df; %序列點(diǎn)數(shù)
time = (N-1)./fs; %第一個(gè)聲音片段的總時(shí)長(zhǎng)
t=0:T:(N-1)./fs;
y = sin(2*pi*200*t); %生成第一個(gè)聲音片段,注意需要用db2mag()函數(shù)把dB轉(zhuǎn)換成magnitude。
sound(y,fs) %可以播放聲音的函數(shù) sound()
filename = ('sinwave.wav'); %給文件取名
plot(t,y)
audiowrite(filename,y,fs) %存儲(chǔ).wav音頻文件,在這里文件名為sinwave.wav
其中生成的正弦波波形如下圖所示:

2.2 python讀取wav文件
import wave import numpy as np import pylab as plt #打開wav文件 ,open返回一個(gè)的是一個(gè)Wave_read類的實(shí)例,通過調(diào)用它的方法讀取WAV文件的格式和數(shù)據(jù)。 f = wave.open(r"E:\練習(xí)\音頻信號(hào)處理\spectrum.m\sinwave.wav","rb") #讀取格式信息 #一次性返回所有的WAV文件的格式信息,它返回的是一個(gè)組元(tuple):聲道數(shù), 量化位數(shù)(byte單位), 采 #樣頻率, 采樣點(diǎn)數(shù), 壓縮類型, 壓縮類型的描述。wave模塊只支持非壓縮的數(shù)據(jù),因此可以忽略最后兩個(gè)信息 params = f.getparams() nchannels, sampwidth, framerate, nframes = params[:4] #讀取波形數(shù)據(jù) #讀取聲音數(shù)據(jù),傳遞一個(gè)參數(shù)指定需要讀取的長(zhǎng)度(以取樣點(diǎn)為單位) str_data = f.readframes(nframes) f.close() #將波形數(shù)據(jù)轉(zhuǎn)換成數(shù)組 #需要根據(jù)聲道數(shù)和量化單位,將讀取的二進(jìn)制數(shù)據(jù)轉(zhuǎn)換為一個(gè)可以計(jì)算的數(shù)組 wave_data = np.fromstring(str_data,dtype=np.short) #通過取樣點(diǎn)數(shù)和取樣頻率計(jì)算出每個(gè)取樣的時(shí)間。 time=np.arange(0,nframes)/framerate print(params) print(wave_data.max())#找出正弦波的峰值 #time 也是一個(gè)數(shù)組,與wave_data[0]或wave_data[1]配對(duì)形成系列點(diǎn)坐標(biāo) plt.plot(time,wave_data/32768) plt.show()
python讀取wav文件顯示出來的正弦波如下圖所示:

python讀取wav文件的信息及求出波形峰值的結(jié)果如下圖所示:

我們可以看出峰值為32767(該wav文件有16bit,且?guī)б粋€(gè)符號(hào)位。215=32768215=32768 ),我們進(jìn)行歸一化處理后的到波形如下圖所示:

由上圖可以看出MATLAB生成的正弦波保存為wav文件后,python讀取該wav文件。兩種語(yǔ)言下正弦波相同。
以上這篇Python 讀取WAV音頻文件 畫頻譜的實(shí)例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
Python常用列表數(shù)據(jù)結(jié)構(gòu)小結(jié)
Python基礎(chǔ)請(qǐng)求庫(kù)urllib模塊使用深入探究
python time模塊時(shí)間戳 與 結(jié)構(gòu)化時(shí)間詳解
使用Python解析JSON的實(shí)現(xiàn)示例
Python 創(chuàng)建子進(jìn)程模塊subprocess詳解
jupyter .ipynb轉(zhuǎn).py的實(shí)現(xiàn)操作

