用Python下載一個(gè)網(wǎng)頁保存為本地的HTML文件實(shí)例
我們可以用Python來將一個(gè)網(wǎng)頁保存為本地的HTML文件,這需要用到urllib庫。
比如我們要下載山東大學(xué)新聞網(wǎng)的一個(gè)頁面,該網(wǎng)頁如下:

實(shí)現(xiàn)代碼如下:
import urllib.request
def getHtml(url):
html = urllib.request.urlopen(url).read()
return html
def saveHtml(file_name, file_content):
# 注意windows文件命名的禁用符,比如 /
with open(file_name.replace('/', '_') + ".html", "wb") as f:
# 寫文件用bytes而不是str,所以要轉(zhuǎn)碼
f.write(file_content)
aurl = "http://www.view.sdu.edu.cn/info/1003/75240.htm"
html = getHtml(aurl)
saveHtml("sduview", html)
print("下載成功")
打開相應(yīng)的目錄可以看到這個(gè)網(wǎng)頁已經(jīng)被下載保存成功了

我們用瀏覽器打開這個(gè)網(wǎng)頁文件如下

由于我們只是下載了網(wǎng)頁的主要源碼,其中的很多圖片之類的文件都不在這里。因此這種方法只適用于提取文字內(nèi)容。
以上這篇用Python下載一個(gè)網(wǎng)頁保存為本地的HTML文件實(shí)例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
python區(qū)塊鏈簡易版交易實(shí)現(xiàn)示例
這篇文章主要為大家介紹了python區(qū)塊鏈簡易版交易實(shí)現(xiàn)示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05
有關(guān)pycharm登錄github時(shí)有的時(shí)候會報(bào)錯(cuò)connection reset的問題
這篇文章主要介紹了有關(guān)pycharm登錄github時(shí)有的時(shí)候會報(bào)錯(cuò)connection reset的問題,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-09-09
Python函數(shù)式編程模塊functools的使用與實(shí)踐
本文主要介紹了Python函數(shù)式編程模塊functools的使用與實(shí)踐,教你如何使用?functools.partial、functools.wraps、functools.lru_cache?和?functools.reduce,感興趣的可以了解一下2024-03-03
Python實(shí)現(xiàn)計(jì)算圓周率π的值到任意位的方法示例
這篇文章主要介紹了Python實(shí)現(xiàn)計(jì)算圓周率π的值到任意位的方法,簡單分析了圓周率的計(jì)算原理,并結(jié)合實(shí)例形式分析了Python計(jì)算圓周率的相關(guān)操作技巧,需要的朋友可以參考下2018-05-05
Python Pycharm虛擬下百度飛漿PaddleX安裝報(bào)錯(cuò)問題及處理方法(親測100%有效)
最近很多朋友給小編留言在安裝PaddleX的時(shí)候總是出現(xiàn)各種奇葩問題,不知道該怎么處理,今天小編通過本文給大家介紹下Python Pycharm虛擬下百度飛漿PaddleX安裝報(bào)錯(cuò)問題及處理方法,真的有效,遇到同樣問題的朋友快來參考下吧2021-05-05
python中dot函數(shù)運(yùn)算過程總結(jié)
dot函數(shù)為numpy庫下的一個(gè)函數(shù),主要用于矩陣的乘法運(yùn)算,其中包括:向量內(nèi)積、多維矩陣乘法和矩陣與向量的乘法,下面這篇文章主要給大家介紹了關(guān)于python中dot函數(shù)運(yùn)算過程的相關(guān)資料,需要的朋友可以參考下2022-09-09
python正則表達(dá)式實(shí)現(xiàn)自動(dòng)化編程
這篇文章主要介紹了python正則表達(dá)式實(shí)現(xiàn)自動(dòng)化編程,re模塊的compile()方法是構(gòu)成正則表達(dá)式的方法,向compile()傳入一個(gè)字符串表示正則表達(dá)式,該方法返回一個(gè)Regex模式的對象,需要的朋友可以參考下2023-01-01

