Python讀取網(wǎng)頁(yè)內(nèi)容的方法
更新時(shí)間:2015年07月30日 16:57:50 作者:寫代碼沒錢途
這篇文章主要介紹了Python讀取網(wǎng)頁(yè)內(nèi)容的方法,實(shí)例分析了Python基于URL讀取網(wǎng)頁(yè)內(nèi)容的相關(guān)技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下
本文實(shí)例講述了Python讀取網(wǎng)頁(yè)內(nèi)容的方法。分享給大家供大家參考。具體如下:
import urllib2
#encoding = utf-8
class Crawler:
def main(self):
#req = urllib2.Request('http://www.baidu.com/')
#req.add_header('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:5.0)')
#urllib2.socket.setdefaulttimeout(10) # 超時(shí)10秒
#page = urllib2.urlopen(req)
page = urllib2.urlopen('http://www.google.com', timeout=10)
data = page.read()
print data
print len(data) #計(jì)算字節(jié)長(zhǎng)度
if __name__ == '__main__':
me=Crawler()
me.main()
希望本文所述對(duì)大家的Python程序設(shè)計(jì)有所幫助。
您可能感興趣的文章:
- python打開url并按指定塊讀取網(wǎng)頁(yè)內(nèi)容的方法
- Python讀取本地文件并解析網(wǎng)頁(yè)元素的方法
- Python中文分詞工具之結(jié)巴分詞用法實(shí)例總結(jié)【經(jīng)典案例】
- Python 結(jié)巴分詞實(shí)現(xiàn)關(guān)鍵詞抽取分析
- python jieba分詞并統(tǒng)計(jì)詞頻后輸出結(jié)果到Excel和txt文檔方法
- python使用jieba實(shí)現(xiàn)中文分詞去停用詞方法示例
- python中文分詞教程之前向最大正向匹配算法詳解
- Python基于jieba庫(kù)進(jìn)行簡(jiǎn)單分詞及詞云功能實(shí)現(xiàn)方法
- python實(shí)現(xiàn)中文分詞FMM算法實(shí)例
- Python中文分詞實(shí)現(xiàn)方法(安裝pymmseg)
- python中文分詞,使用結(jié)巴分詞對(duì)python進(jìn)行分詞(實(shí)例講解)
- python實(shí)現(xiàn)的讀取網(wǎng)頁(yè)并分詞功能示例
相關(guān)文章
Python中自然語(yǔ)言處理和文本挖掘的常規(guī)操作詳解
自然語(yǔ)言處理和文本挖掘是數(shù)據(jù)科學(xué)中的重要領(lǐng)域,涉及對(duì)文本數(shù)據(jù)的分析和處理,這篇文章為大家介紹了一些常見的任務(wù)和實(shí)現(xiàn)方法,需要的可以了解下2025-02-02
Python中實(shí)現(xiàn)一行拆多行和多行并一行的示例代碼
這篇文章主要介紹了Python中實(shí)現(xiàn)一行拆多行和多行并一行的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-09-09

