python 制作網(wǎng)站小說下載器
基本開發(fā)環(huán)境
· Python 3.6
· Pycharm
相關(guān)模塊使用

目標(biāo)網(wǎng)頁分析

輸入想看的小說內(nèi)容,點擊搜索

這里會返回很多結(jié)果,我只選擇第一個
網(wǎng)頁數(shù)據(jù)是靜態(tài)數(shù)據(jù),但是要搜索,是post請求,需要提價data參數(shù),如下圖所示:

然后通過解析網(wǎng)站數(shù)據(jù),獲取第一個小說i的詳情頁url即可
靜態(tài)網(wǎng)頁的獲取,難度是不大的。
def search():
search_url = 'http://www.xbiquge.la/modules/article/waps.php'
data = {
'searchkey': name
}
response = requests.post(url=search_url, data=data, headers=headers)
selector = get_parsing(response.text)
novel_url = selector.css('.even a::attr(href)').extract_first()
1、獲取每本小說的章節(jié)名以及url地址
所有的章節(jié)名以及url地址,都包含在dd標(biāo)簽里面

2、獲取url后,需要拼接
'/23/23019/11409705.html' # 這是網(wǎng)頁獲取到的url 'http://www.xbiquge.la/23/23019/11409705.html' # 這是真實的小說章節(jié)內(nèi)容url地址
3、小說名字,直接獲取即可。
def download_one_book(index_url):
response = get_response(index_url)
response.encoding = response.apparent_encoding
sel = get_parsing(response.text)
book_name = sel.css('#info h1::text').get()
# 提取了所有章節(jié)的下載地址
urls = sel.css('#list dd a::attr(href)').getall()
# 不要最新的 12 章放在最前main
for url in urls:
chapter_url = 'http://www.xbiquge.la' + url
print(chapter_url)
保存下載每章小說內(nèi)容
def download_one_chapter(chapter_url, book_name):
response = get_response(chapter_url)
response.encoding = response.apparent_encoding
html = response.text
selector = get_parsing(html)
h1 = selector.css('.bookname h1::text').get()
content = selector.css('#content::text').getall()
lines = []
for c in content:
lines.append(c.strip())
print(h1)
text = '\n'.join(lines)
file = open(book_name + '.txt', mode='a', encoding='utf-8')
file.write(h1)
file.write('\n')
file.write(text)
file.write('\n')
file.close()
小說軟件界面
root = Tk()
root.title('小說下載器')
root.geometry('560x450+400+200')
label = Label(root, text='請輸入下載小說名字:', font=('華文行楷', 20))
label.grid()
entry = Entry(root, font=('隸書', 20))
entry.grid(row=0, column=1)
text = Listbox(root, font=('隸書', 16), width=50, heigh=15)
text.grid(row=2, columnspan=2)
button1 = Button(root, text='開始下載', font=('隸書', 15), command=search)
button1.grid(row=3, column=0)
button2 = Button(root, text='退出程序', font=('隸書', 15), command=root.quit)
button2.grid(row=3, column=1)
root.mainloop()
顯示下載內(nèi)容
def novel_load(title):
text.insert(END, '正在保存:{}'.format(title))
# 文本框滾動
text.see(END)
# 更新
text.update()
實現(xiàn)效果

以上就是python 制作網(wǎng)站小說下載器的詳細(xì)內(nèi)容,更多關(guān)于python 小說下載器的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
python數(shù)字圖像處理數(shù)據(jù)類型及顏色空間轉(zhuǎn)換
這篇文章主要為大家介紹了python數(shù)字圖像處理數(shù)據(jù)類型及顏色空間轉(zhuǎn)換示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-06-06
pandas數(shù)據(jù)篩選和csv操作的實現(xiàn)方法
這篇文章主要介紹了pandas數(shù)據(jù)篩選和csv操作的實現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07
淺談tensorflow1.0 池化層(pooling)和全連接層(dense)
本篇文章主要介紹了淺談tensorflow1.0 池化層(pooling)和全連接層(dense),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-04-04
python一招完美搞定Chromedriver的自動更新問題
這篇文章主要介紹了python一招完美搞定Chromedriver的自動更新,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2022-09-09

