PHP的數(shù)組中提高元素查找與元素去重的效率的技巧解析
提高查找數(shù)組元素的效率
1.php in_array方法說明
php查找數(shù)組元素是否存在,一般會(huì)使用in_array方法。
bool in_array ( mixed $needle , array $haystack [, bool $strict = FALSE ] )
參數(shù)說明:
needle
待搜索的值,如果needle是字符串,比較是區(qū)分大小寫的。
haystack
用來比較的數(shù)組
strict
如果第三個(gè)參數(shù) strict 的值為 TRUE 則 in_array() 函數(shù)還會(huì)檢查 needle 的類型是否和 haystack 中的相同
返回值
如果找到 needle 則返回 TRUE,否則返回 FALSE。
2.in_array查找元素效率
當(dāng)比較的數(shù)組haystack較大時(shí),in_array效率會(huì)很低
例子:使用in_array對(duì)有10萬個(gè)元素的數(shù)組進(jìn)行1000次比較
<?php
$arr = array();
// 創(chuàng)建10萬個(gè)元素的數(shù)組
for($i=0; $i<100000; $i++){
$arr[] = $i;
}
// 記錄開始時(shí)間
$starttime = getMicrotime();
// 隨機(jī)創(chuàng)建1000個(gè)數(shù)字使用in_array比較
for($j=0; $j<1000; $j++){
$str = mt_rand(1,99999);
in_array($str, $arr);
}
// 記錄結(jié)束時(shí)間
$endtime = getMicrotime();
echo 'run time:'.(float)(($endtime-$starttime)*1000).'ms<br>';
/**
* 獲取microtime
* @return float
*/
function getMicrotime(){
list($usec, $sec) = explode(' ', microtime());
return (float)$usec + (float)$sec;
}
?>
run time:2003.6449432373ms
使用in_array判斷元素是否存在,在10萬個(gè)元素的數(shù)組中比較1000次,運(yùn)行時(shí)間需要約2秒
3.提高查找元素效率方法
我們可以先使用array_flip進(jìn)行鍵值互換,然后使用isset方法來判斷元素是否存在,這樣可以提高效率。
例子:使用array_flip先進(jìn)行鍵值互換,再使用isset方法判斷,在10萬個(gè)元素的數(shù)組中比較1000次
<?php
$arr = array();
// 創(chuàng)建10萬個(gè)元素的數(shù)組
for($i=0; $i<100000; $i++){
$arr[] = $i;
}
// 鍵值互換
$arr = array_flip($arr);
// 記錄開始時(shí)間
$starttime = getMicrotime();
// 隨機(jī)創(chuàng)建1000個(gè)數(shù)字使用isset比較
for($j=0; $j<1000; $j++){
$str = mt_rand(1,99999);
isset($arr[$str]);
}
// 記錄結(jié)束時(shí)間
$endtime = getMicrotime();
echo 'run time:'.(float)(($endtime-$starttime)*1000).'ms<br>';
/**
* 獲取microtime
* @return float
*/
function getMicrotime(){
list($usec, $sec) = explode(' ', microtime());
return (float)$usec + (float)$sec;
}
?>
run time:1.2781620025635ms
使用array_flip與isset判斷元素是否存在,在10萬個(gè)元素的數(shù)組中比較1000次,運(yùn)行時(shí)間需要約1.2毫秒
因此,對(duì)于大數(shù)組進(jìn)行比較,使用array_flip與isset方法會(huì)比in_array效率高很多。
快速去重
1.使用array_unique方法進(jìn)行去重
對(duì)數(shù)組元素進(jìn)行去重,我們一般會(huì)使用array_unique方法,使用這個(gè)方法可以把數(shù)組中的元素去重。
<?php $arr = array(1,1,2,3,3,3,4,4,5,6,6,7,8,8,9,9,9); $arr = array_unique($arr); $arr = array_values($arr); print_r($arr); ?>
輸出:
Array ( [0] => 1 [1] => 2 [2] => 3 [3] => 4 [4] => 5 [5] => 6 [6] => 7 [7] => 8 [8] => 9 )
去重后,鍵值會(huì)不按順序,可以使用array_values把鍵值重新排序。
2.使用array_unique方法去重效率
<?php
$arr = array();
// 創(chuàng)建100000個(gè)隨機(jī)元素的數(shù)組
for($i=0; $i<100000; $i++){
$arr[] = mt_rand(1,99);
}
// 記錄開始時(shí)間
$starttime = getMicrotime();
// 去重
$arr = array_unique($arr);
// 記錄結(jié)束時(shí)間
$endtime = getMicrotime();
$arr = array_values($arr);
echo 'unique count:'.count($arr).'<br>';
echo 'run time:'.(float)(($endtime-$starttime)*1000).'ms<br>';
echo 'use memory:'.getUseMemory();
/**
* 獲取使用內(nèi)存
* @return float
*/
function getUseMemory(){
$use_memory = round(memory_get_usage(true)/1024,2).'kb';
return $use_memory;
}
/**
* 獲取microtime
* @return float
*/
function getMicrotime(){
list($usec, $sec) = explode(' ', microtime());
return (float)$usec + (float)$sec;
}
?>
unique count:99 run time:653.39303016663ms use memory:5120kb
使用array_unique方法去重,運(yùn)行時(shí)間需要約650ms,內(nèi)存占用約5m
3.更快的數(shù)組去重方法
php有一個(gè)鍵值互換的方法array_flip,我們可以使用這個(gè)方法去重,因?yàn)殒I值互換,原來重復(fù)的值會(huì)變?yōu)橄嗤逆I。
然后再進(jìn)行一次鍵值互換,把鍵和值換回來則可以完成去重。
<?php
$arr = array();
// 創(chuàng)建100000個(gè)隨機(jī)元素的數(shù)組
for($i=0; $i<100000; $i++){
$arr[] = mt_rand(1,99);
}
// 記錄開始時(shí)間
$starttime = getMicrotime();
// 使用鍵值互換去重
$arr = array_flip($arr);
$arr = array_flip($arr);
// 記錄結(jié)束時(shí)間
$endtime = getMicrotime();
$arr = array_values($arr);
echo 'unique count:'.count($arr).'<br>';
echo 'run time:'.(float)(($endtime-$starttime)*1000).'ms<br>';
echo 'use memory:'.getUseMemory();
/**
* 獲取使用內(nèi)存
* @return float
*/
function getUseMemory(){
$use_memory = round(memory_get_usage(true)/1024,2).'kb';
return $use_memory;
}
/**
* 獲取microtime
* @return float
*/
function getMicrotime(){
list($usec, $sec) = explode(' ', microtime());
return (float)$usec + (float)$sec;
}
?>
unique count:99 run time:12.840032577515ms use memory:768kb
使用array_flip方法去重,運(yùn)行時(shí)間需要約18ms,內(nèi)存占用約2m
因此使用array_flip方法去重比使用array_unique方法運(yùn)行時(shí)間減少98%,內(nèi)存占用減少4/5;
相關(guān)文章
PHP Session 變量的使用方法詳解與實(shí)例代碼
在php中Session經(jīng)常用來驗(yàn)證用戶注冊(cè)或登錄之后的驗(yàn)證了,下面我來總結(jié)session變量的一些常用實(shí)例與用法介紹2013-09-09
php+js實(shí)現(xiàn)百度地圖多點(diǎn)標(biāo)注的方法
這篇文章主要介紹了php+js實(shí)現(xiàn)百度地圖多點(diǎn)標(biāo)注的方法,涉及php結(jié)合js針對(duì)百度地圖接口調(diào)用與json操作相關(guān)技巧,需要的朋友可以參考下2016-11-11
php調(diào)用KyotoTycoon簡(jiǎn)單實(shí)例
這篇文章主要介紹了php調(diào)用KyotoTycoon簡(jiǎn)單實(shí)例,涉及php調(diào)用KyotoTycoon的簡(jiǎn)單使用方法,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-04-04
php+mysqli使用面向?qū)ο蠓绞礁聰?shù)據(jù)庫(kù)實(shí)例
這篇文章主要介紹了php+mysqli使用面向?qū)ο蠓绞礁聰?shù)據(jù)庫(kù)的方法,實(shí)例分析了mysqli對(duì)象的創(chuàng)建、連接、更新及返回更新結(jié)果的技巧,需要的朋友可以參考下2015-01-01
php結(jié)合curl實(shí)現(xiàn)多線程抓取
PHP利用 Curl可以完成各種傳送文件操作,比如模擬瀏覽器發(fā)送GET,POST請(qǐng)求等等,然而因?yàn)閜hp語(yǔ)言本身不支持多線程,所以開發(fā)爬蟲程序效率并不高,因此經(jīng)常需要借助Curl Multi Functions 這個(gè)功能實(shí)現(xiàn)并發(fā)多線程的訪問多個(gè)url地址以實(shí)現(xiàn)并發(fā)多線程抓取網(wǎng)頁(yè)或者下載文件2015-07-07

