火車采集器 免費版使出收費版本功能實現(xiàn)原理
更新時間:2009年09月17日 20:35:59 作者:
火車頭免費版本不支持采集結(jié)果的外掛處理,比如采用php來輔助處理結(jié)果,而火車頭本身對于正則表達(dá)式的不完整支持,
hi 各位免費火車頭采集器的采友:
火車頭免費版本不支持采集結(jié)果的外掛處理,比如采用php來輔助處理結(jié)果,而火車頭本身對于正則表達(dá)式的不完整支持,
導(dǎo)致對于采集一些有混淆文字的內(nèi)容效果不好,那么咱們怎么做到過濾那些混淆字串呢?
其實很簡單--采用服務(wù)器端過濾
比如采集發(fā)送到服務(wù)器端是:
$_POST = array("subject"=> "這里是標(biāo)題","content"=> "<div class='1fadfafasfasdf'>混淆文字</div>這里是內(nèi)容");
在服務(wù)器端我們稍加處理:
$_POST["content"] = preg_replace("正則表達(dá)式","",$_POST["content"]);
就可以使用熟悉的工具完成工作。
有朋友說了,我服務(wù)器端代碼是加密的怎么辦?
其實很簡單 比如 add.php 加密 ,那么將add.php 改名為 add_ori.php
然后建立新的 add.php
<?
//處理上傳來的數(shù)據(jù)
....
include dirname(__FILE__)."/add_ori.php";
?>
這樣就可以了
火車頭免費版本不支持采集結(jié)果的外掛處理,比如采用php來輔助處理結(jié)果,而火車頭本身對于正則表達(dá)式的不完整支持,
導(dǎo)致對于采集一些有混淆文字的內(nèi)容效果不好,那么咱們怎么做到過濾那些混淆字串呢?
其實很簡單--采用服務(wù)器端過濾
比如采集發(fā)送到服務(wù)器端是:
$_POST = array("subject"=> "這里是標(biāo)題","content"=> "<div class='1fadfafasfasdf'>混淆文字</div>這里是內(nèi)容");
在服務(wù)器端我們稍加處理:
$_POST["content"] = preg_replace("正則表達(dá)式","",$_POST["content"]);
就可以使用熟悉的工具完成工作。
有朋友說了,我服務(wù)器端代碼是加密的怎么辦?
其實很簡單 比如 add.php 加密 ,那么將add.php 改名為 add_ori.php
然后建立新的 add.php
<?
//處理上傳來的數(shù)據(jù)
....
include dirname(__FILE__)."/add_ori.php";
?>
這樣就可以了
相關(guān)文章
讓你的WINDOWS同時支持MYSQL4,MYSQL4.1,MYSQL5X
讓你的WINDOWS同時支持MYSQL4,MYSQL4.1,MYSQL5X...2006-12-12
php ob_flush,flush在ie中緩沖無效的解決方法
一些版本的 Microsoft Internet Explorer 只有當(dāng)接受到的256個字節(jié)以后才開始顯示該頁面,所以必須發(fā)送一些額外的空格來讓這些瀏覽器顯示頁面內(nèi)容。2010-05-05
PHP中調(diào)用ASP.NET的WebService的代碼
創(chuàng)建一個C#的web service,這個就不多說了,我用vs2008的wizard創(chuàng)建了一個最簡單的,讓它運行在:http://localhost/webservice1/service1.asmx2011-04-04
php模擬socket一次連接,多次發(fā)送數(shù)據(jù)的實現(xiàn)代碼
php模擬socket一次連接,多次發(fā)送數(shù)據(jù)的實現(xiàn)代碼,需要的朋友可以參考下。2011-07-07
PHP連接SQLServer2005的實現(xiàn)方法(附ntwdblib.dll下載)
為了php連接sql2005 ,我在網(wǎng)絡(luò)上找了一大堆資料在我的csdn博客中.晚上3:05分時候終于搞定了2012-07-07

