php不用正則采集速度探究總結(jié)
更新時(shí)間:2008年03月24日 19:55:36 作者:
這個(gè)以前有人發(fā)帖子研究過了采集速度,但是之后只是說出了哪個(gè)函數(shù)快并沒有總結(jié),研究問題的目的是要總結(jié)方法。
注意:下面的所有函數(shù)都沒有用正則。
以上為取出第一個(gè)匹配的三個(gè)函數(shù),實(shí)現(xiàn)相同的目的
復(fù)制代碼 代碼如下:
function str_cut($str ,$start, $end) {//取出第一個(gè)匹配,效率最高,先分割再替換
$content = strstr( $str, $start );
$content = substr( $content, strlen( $start ), strpos( $content, $end ) - strlen( $start ) );
return $content;
}
function str_cut1($str ,$start, $end) {//取出第一個(gè)匹配,效率中,直接查找替換
$x = strpos($str, $start);
return substr($str, $x+strlen($start), strpos($str, $end)-$x+strlen($end));
}
function str_cut3($content,$start,$end){//取出第一個(gè)匹配,字符串越大,速度越慢!
$my = explode($start,$content);
$my = explode($end,$my[1]);
return $my[0];
}
以下為取出所有匹配的3個(gè)函數(shù)(全部原創(chuàng)),實(shí)現(xiàn)相同的采集目的
復(fù)制代碼 代碼如下:
function strcut($str ,$start, $end) //先搜個(gè)數(shù),速度中等
{
if( strpos( $str , $start ) )
{
$sum = substr_count($str,$start);
$carr = array();
for($i=0;$i<$sum;$i++){
$str = strstr( $str, $start );
$str = substr( $str, strlen($start));
$carr[] = substr( $str, 0, strpos( $str, $end ) );
}
}
return $carr;
}
function str_cut_all($str ,$start, $end,$carr=array()) //遞歸,運(yùn)行效率最慢!
{
if( strpos( $str , $start ) )
{
$str = strstr( $str, $start );
$str = substr( $str, strlen($start));
$carr[] = substr( $str, 0, strpos( $str, $end ) );
if( strpos( $str , $start ) )
{
return str_cut_all($str ,$start, $end ,$carr );
}
}
return $carr;
}
function my_Ca($content,$start,$end){//取出所有匹配,效率最快,因?yàn)橹蛔x一次,字符串越大越明顯
$m = explode($start,$content);
$a = array();
for( $i = 1;$i < count($m);$i++ )
{
$my = explode($end,$m[$i]);
$a[] = $my[0];
unset($my);
}
return $a;
}
注意my-Ca比較
如果這樣寫:
復(fù)制代碼 代碼如下:
function my_Ca($content,$start,$end){//取出所有匹配
$m = explode($start,$content);
$a = array();
$sum = count($m);
for( $i = 1;$i < $sum;$i++ )
{
$my = explode($end,$m[$i]);
$a[] = $my[0];
unset($my);
}
return $a;
}
速度又快了一些!
由上可以看出,并不是數(shù)組處理函數(shù)(explode)比字符串處理函數(shù)(substr等)慢,也不是那個(gè)比這個(gè)快,因?yàn)樵谄ヅ涠鄠€(gè)數(shù)據(jù)的時(shí)候匹配的越多數(shù)組函數(shù)的優(yōu)勢越大,處理字符串就象切蛋糕一樣越切越小。匹配單個(gè)字符串運(yùn)用切的思路去做也是一樣的效果(str_cut)。關(guān)鍵還是在---算法!算法寫的好,什么函數(shù)都是一樣哦!
相關(guān)文章
PHP 緩存實(shí)現(xiàn)代碼及詳細(xì)注釋
PHP緩存實(shí)現(xiàn),實(shí)現(xiàn)了apc和文件緩存,繼承Cache_Abstract即可實(shí)現(xiàn)調(diào)用第三方的緩存工具。參考shindig的緩存類和apc。2010-05-05
php中實(shí)現(xiàn)進(jìn)程鎖與多進(jìn)程的方法
這篇文章給大家介紹了單進(jìn)程的情況的進(jìn)程鎖實(shí)現(xiàn)、進(jìn)程鎖實(shí)現(xiàn)多進(jìn)程、進(jìn)程鎖在yii2中的實(shí)現(xiàn)以及殺死進(jìn)程的命令,有需要的朋友們可以參考借鑒,下面來一起看看吧。2016-09-09
關(guān)于WordPress的SEO優(yōu)化相關(guān)的一些PHP頁面腳本技巧
這篇文章主要介紹了關(guān)于WordPress的SEO優(yōu)化相關(guān)的一些PHP頁面腳本技巧,包括區(qū)分顯示頁面標(biāo)題和關(guān)鍵字等,需要的朋友可以參考下2015-12-12
PHP CKEditor 上傳圖片實(shí)現(xiàn)代碼
CKEditor的原包中沒有包含圖片的上傳服務(wù)器端處理文件,其公司的另一款開源產(chǎn)品:CKFinder做了很好的補(bǔ)充。但是要下載這個(gè)源代碼再進(jìn)行配置,雖然方便了很多,但是僅僅為了上傳圖片,卻要使用這么大的整個(gè)系統(tǒng)來使用,確實(shí)有點(diǎn)大材小用。2009-11-11

