雨哲防采集策略之列表篇
更新時間:2008年04月29日 22:25:06 作者:
不錯的列表頁防采集方法
在一般的鏈接地址形式如:
1、<a class="鏈接樣式" href="鏈接地址" title="鏈接說明" target="_blank">文章標題</a>
2、<a class='鏈接樣式' href='鏈接地址' title='鏈接說明' target='_blank'>文章標題</a>
大家注意看上面兩行代碼,有一個區(qū)別就是第一個中間使用的是雙引號,第二個使用的是單引號。一般來說,如果在文章列表頁面都使用雙引號或者使用單引號,很容易讓采集者找到文章路徑(開始代碼:href=' ,結(jié)束代碼:' )。
那如果我們混合著用,也就是有的使用單引號,有的使用雙引號,那么就會給采集者帶來一定的麻煩。至少他不能采集到所有文章(如果采集程序差一點的話可能一篇也采集不到)。
在上面的基礎(chǔ)上,更深入一步將A中間的參數(shù)進行隨機排列:
<a href="鏈接地址" title="鏈接說明" target="_blank" class="鏈接樣式">
<a href="鏈接地址" class="鏈接樣式" title="鏈接說明" target="_blank">
<a title="鏈接說明" href="鏈接地址" class="鏈接樣式" target="_blank">
然后再在其中混用單雙引號,在href=后面還可以不使用引號。那么采集者將不能正確獲取列表頁面中文章地址。
再深入一步,可以在列表中加入干擾碼,如把鏈接部分重復(fù)加一次空白鏈接,(<a href="鏈接地址" title="鏈接說明" target="_blank" class="鏈接樣式"></a>),那么如果對方能夠獲取一部分文章地址,或者能夠采集一部分文章,那么這部分文章也肯定是重復(fù)的。
在進行以上修改后,我想大部分采集者都會知難退的哈。缺點就是代碼不太標準。以上僅雨哲個人觀點。
復(fù)制代碼 代碼如下:
1、<a class="鏈接樣式" href="鏈接地址" title="鏈接說明" target="_blank">文章標題</a>
2、<a class='鏈接樣式' href='鏈接地址' title='鏈接說明' target='_blank'>文章標題</a>
大家注意看上面兩行代碼,有一個區(qū)別就是第一個中間使用的是雙引號,第二個使用的是單引號。一般來說,如果在文章列表頁面都使用雙引號或者使用單引號,很容易讓采集者找到文章路徑(開始代碼:href=' ,結(jié)束代碼:' )。
那如果我們混合著用,也就是有的使用單引號,有的使用雙引號,那么就會給采集者帶來一定的麻煩。至少他不能采集到所有文章(如果采集程序差一點的話可能一篇也采集不到)。
在上面的基礎(chǔ)上,更深入一步將A中間的參數(shù)進行隨機排列:
復(fù)制代碼 代碼如下:
<a href="鏈接地址" title="鏈接說明" target="_blank" class="鏈接樣式">
<a href="鏈接地址" class="鏈接樣式" title="鏈接說明" target="_blank">
<a title="鏈接說明" href="鏈接地址" class="鏈接樣式" target="_blank">
再深入一步,可以在列表中加入干擾碼,如把鏈接部分重復(fù)加一次空白鏈接,(<a href="鏈接地址" title="鏈接說明" target="_blank" class="鏈接樣式"></a>),那么如果對方能夠獲取一部分文章地址,或者能夠采集一部分文章,那么這部分文章也肯定是重復(fù)的。
在進行以上修改后,我想大部分采集者都會知難退的哈。缺點就是代碼不太標準。以上僅雨哲個人觀點。
相關(guān)文章
asp使用AspJson轉(zhuǎn)換json數(shù)據(jù)
需要使用json數(shù)據(jù)的場景很多,那么asp中如何操作json數(shù)據(jù)呢?asp與json格式又如何交互呢?本文介紹使用AspJson轉(zhuǎn)換為json格式數(shù)據(jù)輸出,以及解析json數(shù)據(jù)2024-01-01
重置TSYS系統(tǒng)中的所有"生成的文件"成"未生成文件"
重置TSYS系統(tǒng)中的所有"生成的文件"成"未生成文件"...2007-01-01
實現(xiàn)UTF8轉(zhuǎn)換GB2312國標碼的asp代碼
ASP來實現(xiàn)UTF8轉(zhuǎn)換GB2312國標碼-GB2312轉(zhuǎn)UTF-8,需要的朋友可以參考下。2010-04-04
asp 實現(xiàn)顯示所有的服務(wù)器變量值的函數(shù)
asp 實現(xiàn)顯示所有的服務(wù)器變量值的函數(shù)...2007-08-08
asp有效防止網(wǎng)站留言板出現(xiàn)垃圾留言/評論實現(xiàn)思路
如何有效防止網(wǎng)站(留言板)出現(xiàn)垃圾留言,垃圾評論?本文提供詳細解決思路與實現(xiàn)步驟,需要了解的朋友可以參考下2012-12-12
ASP 遞歸調(diào)用 已知節(jié)點查找根節(jié)點的函數(shù)
已知節(jié)點查找根節(jié)點的asp函數(shù)2009-12-12
使用ASP在IIS創(chuàng)建WEB站點的函數(shù)
使用ASP在IIS創(chuàng)建WEB站點的函數(shù)...2007-01-01

