python爬取”頂點小說網“《純陽劍尊》的示例代碼

更新時間：2020年10月16日 09:29:39 作者：Gg、

這篇文章主要介紹了python爬取”頂點小說網“《純陽劍尊》的示例代碼，幫助大家更好的利用python 爬蟲爬取數據，感興趣的朋友可以了解下

爬取”頂點小說網“《純陽劍尊》

代碼

import requests
from bs4 import BeautifulSoup
# 反爬
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, \
  like Gecko) Chrome/70.0.3538.102 Safari/537.36'
}

# 獲得請求
def open_url(url):
  response = requests.get(url, headers=headers)
  response.encoding = response.apparent_encoding
  html = response.text
  return html

# 提取標題
def get_title(url):
  soup = BeautifulSoup(url, 'lxml')
  title_tag = soup.find('dd')
  title = '\n' + title_tag.h1.get_text() + '\n'
  return title

# 提取文本
def get_texts(url):
  soup2 = BeautifulSoup(url, 'lxml')
  text_tags = soup2.find_all('dd', id="contents")
  return text_tags

# 保存標題
def save_title(filename, title):
  with open(filename, 'a+', encoding='utf-8') as file:
    file.write(title)

# 保存文本
def save_text(filename, text):
  with open(filename, 'a+', encoding='utf-8') as file:
    file.write(text)

# 主程序函數
def main():
  num = input('《純陽劍尊》你想要下載第幾章？（1-802）')
  num = int(num)
  number = 8184027 + num
  url = 'https://www.23us.so/files/article/html/15/15905/' + str(number) + '.html'
  filename = '純陽劍尊.txt'
  r = open_url(url)
  title = get_title(r)
  tags = get_texts(r)
  save_title(filename, title)
  for text_tag in tags:
    text = text_tag.get_text() + '\n'
    save_text(filename, text)
  print('第{}章已經下載完成！'.format(num))

if __name__ == '__main__':
  main()

爬取結果：

以上就是python爬取”頂點小說網“《純陽劍尊》的示例代碼的詳細內容，更多關于python 爬取頂點小說網的資料請關注腳本之家其它相關文章！

您可能感興趣的文章:

利用Python庫Scapy解析pcap文件的方法
今天小編就為大家分享一篇利用Python庫Scapy解析pcap文件的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-07-07
Python?JMESPath庫輕松操作JSON進行數據查詢方法實例
這篇文章主要為大家介紹了Python?JMESPath庫輕松操作JSON方法實例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
2024-01-01
PyTorch快速搭建神經網絡及其保存提取方法詳解
本篇文章主要介紹了PyTorch快速搭建神經網絡及其保存提取方法詳解，小編覺得挺不錯的，現(xiàn)在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2018-04-04
python在前端頁面使用?MySQLdb?連接數據
這篇文章主要介紹了MySQLdb?連接數據的使用，文章主要介紹的相關內容又插入數據，刪除數據，更新數據，搜索數據，需要的小伙伴可以參考一下
2022-03-03
Python生成器常見問題及解決方案
這篇文章主要介紹了Python生成器常見問題及解決方案,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-03-03
python 通過字符串調用對象屬性或方法的實例講解
下面小編就為大家分享一篇python 通過字符串調用對象屬性或方法的實例講解，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-04-04
pytest中文文檔之編寫斷言
這篇文章主要給大家介紹了關于pytest中文文檔之編寫斷言的相關資料，文中通過示例代碼介紹的非常詳細，對大家學習或者使用pytest具有一定的參考學習價值，需要的朋友們下面來一起學習學習吧
2019-09-09
pytorch中的nn.Unfold()函數和fold()函數解讀
這篇文章主要介紹了pytorch中的nn.Unfold()函數和fold()函數用法,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
2023-08-08
Python基于Tensor FLow的圖像處理操作詳解
這篇文章主要介紹了Python基于Tensor FLow的圖像處理操作,結合實例形式分析了Python基于Tensor FLow操作圖像解碼、縮放、剪切、翻轉、調整對比度、明度、飽和度等相關操作技巧,需要的朋友可以參考下
2020-01-01
Selenium中的option使用示例
這篇文章主要介紹了Selenium中的option用法實例,本文結合示例代碼給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2022-12-12