Python語言實現(xiàn)百度語音識別API的使用實例
未來的一段時間,人工智能在市場上占有很重的位置,Python語言則是研究人工智能的最佳編程語言,下面,就讓我們來感受一下它的魅力吧!
百度給的樣例程序,不論C還是Java版,都分為method1和method2兩種
前者稱為隱式(post的是json串,音頻數(shù)據(jù)編碼到j(luò)son里),后者稱為顯式(post的就是音頻數(shù)據(jù))
一開始考慮到pythonwave包處理的都是“字符串”,擔心跟C語言的數(shù)組不一致,所以選擇低效但保險的method1,
即先將音頻數(shù)據(jù)base64編碼,再加上采樣率、通道數(shù)等信息匯集成dict,最后總體編碼成json串
結(jié)果老是報:
3300輸入?yún)?shù)不正確
先后試過urllib2和pycurl包,都是上面情況
不得已換用method2,成功(看來wave包對音頻的存儲并不是“字符串”)
#encoding=utf-8
import wave
import urllib, urllib2, pycurl
import base64
import json
## get access token by api key & secret key
def get_token():
apiKey = "xxxxxxxx"
secretKey = "xxxxxxxxx"
auth_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=" + apiKey + "&client_secret=" + secretKey;
res = urllib2.urlopen(auth_url)
json_data = res.read()
return json.loads(json_data)['access_token']
def dump_res(buf):
print buf
## post audio to server
def use_cloud(token):
fp = wave.open('vad_0.wav', 'rb')
nf = fp.getnframes()
f_len = nf * 2
audio_data = fp.readframes(nf)
cuid = "xxxxxxxxxx" #my xiaomi phone MAC
srv_url = 'http://vop.baidu.com/server_api' + '?cuid=' + cuid + '&token=' + token
http_header = [
'Content-Type: audio/pcm; rate=8000',
'Content-Length: %d' % f_len
]
c = pycurl.Curl()
c.setopt(pycurl.URL, str(srv_url)) #curl doesn't support unicode
#c.setopt(c.RETURNTRANSFER, 1)
c.setopt(c.HTTPHEADER, http_header) #must be list, not dict
c.setopt(c.POST, 1)
c.setopt(c.CONNECTTIMEOUT, 30)
c.setopt(c.TIMEOUT, 30)
c.setopt(c.WRITEFUNCTION, dump_res)
c.setopt(c.POSTFIELDS, audio_data)
c.setopt(c.POSTFIELDSIZE, f_len)
c.perform() #pycurl.perform() has no return val
if __name__ == "__main__":
token = get_token()
use_cloud(token)
運行結(jié)果
{"corpus_no":"6150045491002357923","err_msg":"success.","err_no":0,"result":["播放小蘋果,"],"sn":"243903724071431919050"}
總結(jié)
以上就是本文關(guān)于Python語言實現(xiàn)百度語音識別API的使用實例的全部內(nèi)容,希望對大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站:
Python通過Django實現(xiàn)用戶注冊和郵箱驗證功能代碼
python使用pil進行圖像處理(等比例壓縮、裁剪)實例代碼
如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!
相關(guān)文章
使用Python生成F分布表并導(dǎo)出為Excel文件的代碼實現(xiàn)
在統(tǒng)計分析中,F FF分布是一種非常重要的連續(xù)概率分布,廣泛應(yīng)用于方差分析、回歸分析的顯著性檢驗等場景,為了方便查閱和使用F分布的臨界值,本文給大家介紹了使用Python生成F分布表并導(dǎo)出為Excel文件,需要的朋友可以參考下2024-11-11
Python3利用openpyxl讀寫Excel文件的方法實例
這篇文章主要給大家介紹了關(guān)于Python3利用openpyxl讀寫Excel文件的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2021-02-02
在python中計算ssim的方法(與Matlab結(jié)果一致)
這篇文章主要介紹了在python中計算ssim的方法(與Matlab結(jié)果一致),本文通過實例代碼給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2019-12-12
Python tabulate結(jié)合loguru打印出美觀方便的日志記錄
在開發(fā)過程中經(jīng)常碰到在本地環(huán)境無法完成聯(lián)調(diào)測試的情況,必須到統(tǒng)一的聯(lián)機環(huán)境對接其他系統(tǒng)測試。往往是出現(xiàn)了BUG難以查找數(shù)據(jù)記錄及時定位到錯誤出現(xiàn)的位置。本文將利用tabulate結(jié)合loguru實現(xiàn)打印出美觀方便的日志記錄,需要的可以參考一下2022-10-10

