python實(shí)現(xiàn)從web抓取文檔的方法
本文實(shí)例講述了Python實(shí)現(xiàn)從Web的一個URL中抓取文檔的方法,分享給大家供大家參考。具體方法分析如下:
實(shí)例代碼如下:
import urllib
doc = urllib.urlopen("http://www.python.org").read()
print doc#直接打印出網(wǎng)頁
def reporthook(*a):
print a
#將http://www.renren.com網(wǎng)頁保存到renre.html中,
#每讀取一個塊調(diào)用一字reporthook函數(shù)
urllib.urlretrieve("http://www.renren.com",'renren.html',reporthook)
#將http://www.renren.com網(wǎng)頁保存到renre.html中
urllib.urlretrieve("http://www.renren.com",'renren.html')
程序運(yùn)行結(jié)果如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> ..........................網(wǎng)頁內(nèi)容 </body> </html> (0, 8192, -1) (1, 8192, -1) (2, 8192, -1)
其中urllib.urlopen返回一個類文件對象。
希望本文所述對大家的Python程序設(shè)計有所幫助。
- python實(shí)現(xiàn)udp數(shù)據(jù)報傳輸?shù)姆椒?/a>
- python使用Berkeley DB數(shù)據(jù)庫實(shí)例
- python實(shí)現(xiàn)在pickling的時候壓縮的方法
- python使用marshal模塊序列化實(shí)例
- python中類的一些方法分析
- python實(shí)現(xiàn)獲取序列中最小的幾個元素
- python中bisect模塊用法實(shí)例
- python實(shí)現(xiàn)給字典添加條目的方法
- python實(shí)現(xiàn)忽略大小寫對字符串列表排序的方法
- python對字典進(jìn)行排序?qū)嵗?/a>
- python實(shí)現(xiàn)在無須過多援引的情況下創(chuàng)建字典的方法
- python求眾數(shù)問題實(shí)例
相關(guān)文章
使用Python創(chuàng)建簡單的HTTP服務(wù)器的方法步驟
這篇文章主要介紹了使用Python創(chuàng)建簡單的HTTP服務(wù)器的方法步驟,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-04-04
Python + selenium + requests實(shí)現(xiàn)12306全自動搶票及驗(yàn)證碼破解加自動點(diǎn)擊功能
這篇文章主要介紹了Python + selenium + requests實(shí)現(xiàn)12306全自動搶票及驗(yàn)證碼破解加自動點(diǎn)擊功能,需要的朋友可以參考下2018-11-11
Python實(shí)現(xiàn)數(shù)據(jù)可視化看如何監(jiān)控你的爬蟲狀態(tài)【推薦】
今天主要是來說一下怎么可視化來監(jiān)控你的爬蟲的狀態(tài)。文中通過實(shí)例代碼給大家分析了Python實(shí)現(xiàn)數(shù)據(jù)可視化看如何監(jiān)控你的爬蟲狀態(tài),感興趣的朋友一起看看吧2018-08-08
Python實(shí)現(xiàn)備份文件實(shí)例
這篇文章主要介紹了Python實(shí)現(xiàn)備份文件的方法,可實(shí)現(xiàn)針對各類常見擴(kuò)展名的文件進(jìn)行備份的功能,需要的朋友可以參考下2014-09-09
Python實(shí)現(xiàn)監(jiān)控遠(yuǎn)程主機(jī)實(shí)時數(shù)據(jù)的示例詳解
這篇文章主要為大家詳細(xì)介紹了Python如何使用Socket庫和相應(yīng)的第三方庫來監(jiān)控遠(yuǎn)程主機(jī)的實(shí)時數(shù)據(jù),比如CPU使用率、內(nèi)存使用率、網(wǎng)絡(luò)帶寬等,感興趣的可以了解一下2023-04-04

