Python爬蟲爬取有道實現(xiàn)翻譯功能
更新時間:2020年11月27日 15:24:57 作者:Huny
這篇文章主要介紹了Python爬蟲爬取有道實現(xiàn)翻譯功能,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
準備
首先安裝爬蟲urllib庫
pip install urllib
獲取有道翻譯的鏈接url

需要發(fā)送的參數(shù)在form data里

示例
import urllib.request
import urllib.parse
url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'
data = {}
data['i'] = 'i love python'
data['from'] = 'AUTO'
data['to'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '16057996372935'
data['sign'] = '0965172abb459f8c7a791df4184bf51c'
data['lts'] = '1605799637293'
data['bv'] = 'f7d97c24a497388db1420108e6c3537b'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_REALTlME'
data = urllib.parse.urlencode(data).encode('utf-8')
response = urllib.request.urlopen(url,data)
html = response.read().decode('utf-8')
print(html)
運行會出現(xiàn)50的錯誤,這里需要將url鏈接的_o刪除掉

刪除后運行成功

但是這個結(jié)果看起來還是太復雜,需要在進行優(yōu)化
導入json,然后轉(zhuǎn)換成字典進行過濾
import urllib.request
import urllib.parse
import json
url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
data = {}
data['i'] = 'i love python'
data['from'] = 'AUTO'
data['to'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '16057996372935'
data['sign'] = '0965172abb459f8c7a791df4184bf51c'
data['lts'] = '1605799637293'
data['bv'] = 'f7d97c24a497388db1420108e6c3537b'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_REALTlME'
data = urllib.parse.urlencode(data).encode('utf-8')
response = urllib.request.urlopen(url,data)
html = response.read().decode('utf-8')
req = json.loads(html)
result = req['translateResult'][0][0]['tgt']
print(result)

但是這個程序只能翻譯一個單詞,用完就廢了。于是我在進行優(yōu)化
import urllib.request
import urllib.parse
import json
def translate():
centens = input('輸入要翻譯的語句:')
url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
head = {}#增加請求頭,防反爬蟲
head['User-Agent'] = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
data = {}#帶上from data的數(shù)據(jù)進行請求
data['i'] = centens
data['from'] = 'AUTO'
data['to'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '16057996372935'
data['sign'] = '0965172abb459f8c7a791df4184bf51c'
data['lts'] = '1605799637293'
data['bv'] = 'f7d97c24a497388db1420108e6c3537b'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_REALTlME'
data = urllib.parse.urlencode(data).encode('utf-8')
req = urllib.request.Request(url,data,head)
response = urllib.request.urlopen(req)
html = response.read().decode('utf-8')
req = json.loads(html)
result = req['translateResult'][0][0]['tgt']
# print(f'中英互譯的結(jié)果:{result}')
return result
t = translate()
print(f'中英互譯的結(jié)果:{t}')
優(yōu)化完成,效果還行。

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
您可能感興趣的文章:
- python 實現(xiàn)有道翻譯功能
- Python使用tkinter制作在線翻譯軟件
- Python爬蟲制作翻譯程序的示例代碼
- Python爬蟲+Tkinter制作一個翻譯軟件的示例
- Python結(jié)合百度語音識別實現(xiàn)實時翻譯軟件的實現(xiàn)
- 詳解python使用金山詞霸的翻譯功能(調(diào)試工具斷點的使用)
- python3 googletrans超時報錯問題及翻譯工具優(yōu)化方案 附源碼
- python中翻譯功能translate模塊實現(xiàn)方法
- python 調(diào)用Google翻譯接口的方法
- python 簡單的調(diào)用有道翻譯
- Python 制作自動化翻譯工具
相關(guān)文章
Python?Asyncio庫之a(chǎn)syncio.task常用函數(shù)詳解
Asyncio在經(jīng)過一段時間的發(fā)展以及獲取Curio等第三方庫的經(jīng)驗來提供更多的功能,目前高級功能也基本完善。本文主要介紹了Asyncio庫中asyncio.task常用函數(shù)的使用,需要的可以參考一下2023-03-03
9行Python3代碼實現(xiàn)批量提取PDF文件的指定內(nèi)容
這篇文章主要為大家詳細介紹了如何通過9行Python3代碼實現(xiàn)批量提取PDF文件的指定內(nèi)容,文中的示例代碼講解詳細,感興趣的小伙伴可以嘗試一下2022-12-12

