python版百度語音識別功能
本文實例為大家分享了python版百度語音識別功能的具體代碼,供大家參考,具體內(nèi)容如下
環(huán)境:使用的IDE是Pycharm
1.新建工程
2.配置百度語音識別環(huán)境
“File”——“Settings”打開設(shè)置面板,“Project”標(biāo)簽下添加Project Interpreter,點擊右側(cè)“+”

輸入“baidu-aip”,進行安裝

新建測試文件
from aip import AipSpeech
""" 你的 APPID AK SK """
APP_ID = '******'
API_KEY = '******'
SECRET_KEY = '******'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
# 讀取文件
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
# 識別本地文件
test1 = client.asr(get_file_content('test.pcm'), 'pcm', 16000, {'dev_pid': 1536,})
print(test1)
注意:提交的音頻文件格式推薦是PCM,采樣率16K,16位,單聲道。
轉(zhuǎn)換的文字準(zhǔn)確率還是可以的,但是沒有標(biāo)點符號,這一點比較不滿意:
{'corpus_no': '6670746770877419029', 'err_msg': 'success.', 'err_no': 0, 'result': ['這里是語音轉(zhuǎn)換的結(jié)果看不到標(biāo)點符號'], 'sn': '29336209551553154264'}
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
利用Python將原始邊列表轉(zhuǎn)換為鄰接矩陣的過程
有時候,我們會從外部數(shù)據(jù)源中得到原始的邊列表,而需要將其轉(zhuǎn)換為鄰接矩陣以便進行后續(xù)的分析和處理,本文將介紹如何使用Python來實現(xiàn)這一轉(zhuǎn)換過程,需要的朋友可以參考下2024-04-04
基于Python的socket庫實現(xiàn)通信功能的示例代碼
本文主要給大家介紹了如何使用python的socket庫實現(xiàn)通信功能,這里簡單的給每個客戶端增加一個不重復(fù)的uid,客戶端之間可以根據(jù)這個uid選擇進行廣播通信,感興趣的小伙伴快來看看吧2023-08-08
用python生成與調(diào)用cntk模型代碼演示方法
今天小編就為大家分享一篇用python生成與調(diào)用cntk模型代碼演示方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-08-08
Python實現(xiàn)批量將MP3音頻轉(zhuǎn)為WAV格式詳解
這篇文章主要介紹了通過Python實現(xiàn)將MP3音頻轉(zhuǎn)為WAV格式的方法,文中的示例代碼講解詳細,對我們學(xué)習(xí)Python有一定幫助,感興趣的可以了解一下2021-12-12
淺談cv2.imread()和keras.preprocessing中的image.load_img()區(qū)別
這篇文章主要介紹了淺談cv2.imread()和keras.preprocessing中的image.load_img()區(qū)別說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06
Django 狀態(tài)保持搭配與存儲的實現(xiàn)
本文主要介紹了Django 狀態(tài)保持搭配與存儲的實現(xiàn),文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-06-06

