Python打印scrapy蜘蛛抓取樹結(jié)構(gòu)的方法
更新時間:2015年04月08日 10:14:15 作者:pythoner
這篇文章主要介紹了Python打印scrapy蜘蛛抓取樹結(jié)構(gòu)的方法,實例分析了打印scrapy蜘蛛抓取樹結(jié)構(gòu)的技巧,非常具有實用價值,需要的朋友可以參考下
本文實例講述了Python打印scrapy蜘蛛抓取樹結(jié)構(gòu)的方法。分享給大家供大家參考。具體如下:
通過下面這段代碼可以一目了然的知道scrapy的抓取頁面結(jié)構(gòu),調(diào)用也非常簡單
#!/usr/bin/env python
import fileinput, re
from collections import defaultdict
def print_urls(allurls, referer, indent=0):
urls = allurls[referer]
for url in urls:
print ' '*indent + referer
if url in allurls:
print_urls(allurls, url, indent+2)
def main():
log_re = re.compile(r'<GET (.*?)> \(referer: (.*?)\)')
allurls = defaultdict(list)
for l in fileinput.input():
m = log_re.search(l)
if m:
url, ref = m.groups()
allurls[ref] += [url]
print_urls(allurls, 'None')
main()
希望本文所述對大家的Python程序設計有所幫助。
您可能感興趣的文章:
- 詳解JavaScript樹結(jié)構(gòu)
- JAVA使用geotools讀取shape格式文件的方法
- java后端把數(shù)據(jù)轉(zhuǎn)換為樹,map遞歸生成json樹,返回給前端(后臺轉(zhuǎn)換)
- mybatis實現(xiàn)讀取樹結(jié)構(gòu)數(shù)據(jù)實例代碼
- Python實現(xiàn)二叉樹結(jié)構(gòu)與進行二叉樹遍歷的方法詳解
- C++二叉樹結(jié)構(gòu)的建立與基本操作
- 一個很簡單的jquery+xml+ajax的無刷新樹結(jié)構(gòu)(無css,后臺是c#)
- JavaScript幾種形式的樹結(jié)構(gòu)菜單
- asp下生成目錄樹結(jié)構(gòu)的類
- Java實現(xiàn)簡單樹結(jié)構(gòu)
相關(guān)文章
Python實現(xiàn)自動收集參數(shù)的技巧分享
在Python中,充分利用函數(shù)參數(shù)的自動收集和靈活處理,是寫出高效且易維護代碼的關(guān)鍵之一,本文將深入研究Python函數(shù)參數(shù)的收集方式,感興趣的小伙伴可以了解下2023-12-12

