dedecms采集過濾常用代碼集合
更新時(shí)間:2008年03月23日 18:19:15 作者:
dede采集過程中最麻煩的莫過于采集的正則過濾函數(shù)的編寫。說實(shí)在的,dede在這點(diǎn)上和很多ASP CMS系統(tǒng)比如說動易等,采集的時(shí)候直接選擇幾個(gè)選項(xiàng)就可以了,簡單的完成想過濾的東西。不過他們只局限于對文章內(nèi)容的過濾不是很好。而DEDE卻能對所有采集的字段進(jìn)行過濾,功能上彌補(bǔ)了易用性的缺陷,期待柏拉圖在后續(xù)版本中加上選擇性過濾功能。
下面是在綜合正則的一個(gè)全集:
{dede:trim}
{/dede:trim}
{dede:trim} ]*)>{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} ]*)>([^>]*)
{/dede:trim}
{dede:trim} ]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
應(yīng)用示例一:標(biāo)題中空格的過濾
經(jīng)常在采集文章的時(shí)候,標(biāo)題文字里面有空格,采回來后應(yīng)用很是麻煩,所以需要在過濾處添加下面正則過濾
{dede:trim} {/dede:trim}
應(yīng)用示例二:來源作者中連接的過濾
在采集文章的時(shí)候,有的系統(tǒng)里面作者或者來源處都有連接,直接采集的話將連接采集回來了,然后由于這兩個(gè)字段有限制,通常會造成需要采集的內(nèi)容沒有采集回來,所以需要在過濾處添加下面正則過濾
{dede:trim}]*)>([^<]*){/dede:trim}
應(yīng)用示例三:文章內(nèi)容中連接以及其他廣告代碼的過濾
這個(gè)就不用說了,當(dāng)需要對所有東西過濾的時(shí)候,直接用上面所有的代碼過濾就可以,但是實(shí)際應(yīng)用中,我們只需要對連接、動畫、調(diào)用等進(jìn)行過濾。(這個(gè)需要按照對方內(nèi)容里面具體含有什么代碼來具體操作)
一般的只有鏈接,使用二中的代碼進(jìn)行過濾就可以了,但是實(shí)際上一般的網(wǎng)站現(xiàn)在都在內(nèi)容里面加有廣告等,所以采取下面的過濾正則就可以完成過濾:
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
應(yīng)用示例四:過濾GG廣告代碼
其實(shí)這個(gè)就是在上面的內(nèi)容過濾,但是很多論壇里的網(wǎng)友經(jīng)常問這個(gè),所以單獨(dú)作為一個(gè)應(yīng)用列出來:
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim} ]*)>{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} ]*)>([^>]*)
{/dede:trim}
{dede:trim} ]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
應(yīng)用示例一:標(biāo)題中空格的過濾
經(jīng)常在采集文章的時(shí)候,標(biāo)題文字里面有空格,采回來后應(yīng)用很是麻煩,所以需要在過濾處添加下面正則過濾
{dede:trim} {/dede:trim}
應(yīng)用示例二:來源作者中連接的過濾
在采集文章的時(shí)候,有的系統(tǒng)里面作者或者來源處都有連接,直接采集的話將連接采集回來了,然后由于這兩個(gè)字段有限制,通常會造成需要采集的內(nèi)容沒有采集回來,所以需要在過濾處添加下面正則過濾
{dede:trim}]*)>([^<]*){/dede:trim}
應(yīng)用示例三:文章內(nèi)容中連接以及其他廣告代碼的過濾
這個(gè)就不用說了,當(dāng)需要對所有東西過濾的時(shí)候,直接用上面所有的代碼過濾就可以,但是實(shí)際應(yīng)用中,我們只需要對連接、動畫、調(diào)用等進(jìn)行過濾。(這個(gè)需要按照對方內(nèi)容里面具體含有什么代碼來具體操作)
一般的只有鏈接,使用二中的代碼進(jìn)行過濾就可以了,但是實(shí)際上一般的網(wǎng)站現(xiàn)在都在內(nèi)容里面加有廣告等,所以采取下面的過濾正則就可以完成過濾:
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
應(yīng)用示例四:過濾GG廣告代碼
其實(shí)這個(gè)就是在上面的內(nèi)容過濾,但是很多論壇里的網(wǎng)友經(jīng)常問這個(gè),所以單獨(dú)作為一個(gè)應(yīng)用列出來:
{dede:trim}]*)>([^>]*){/dede:trim}
相關(guān)文章
Dedecms模板常用調(diào)用標(biāo)簽代碼整理
因?yàn)橐恢庇玫絛edecms的模板,特把經(jīng)常用到的調(diào)用標(biāo)簽代碼整理如下2008-05-05
參考Dedecms整合Discuz完全攻略實(shí)現(xiàn)最新的結(jié)合
看到還有很多同學(xué)和我一樣,說配置不成功,經(jīng)測試及同學(xué)們的指點(diǎn),我整合成功了,以下是配置過程,供大家參考2008-06-06
dedecms織夢系統(tǒng)數(shù)據(jù)庫表結(jié)構(gòu)詳細(xì)說明-附表名與字段名
dedecms織夢系統(tǒng)是一個(gè)自由和開放源碼的內(nèi)容管理系統(tǒng),簡單易用,功能豐富,原生php程序,二開簡單,曾經(jīng)流行了好多年,就是現(xiàn)在還有人再使用。本文囊括了dedecms數(shù)據(jù)庫所有的86張數(shù)據(jù)表結(jié)構(gòu)和字段詳細(xì)說明,需要的朋友可以參考下。2023-04-04
DEDECMS后臺數(shù)據(jù)備份還原的應(yīng)用
前臺與測試過程--之備份與還原2009-02-02

