phpQuery占用內(nèi)存過多的處理方法
更新時間:2013年11月13日 10:30:04 作者:
本文解決phpQuery占用內(nèi)存過多的問題
phpQuery是一個用php實現(xiàn)的類似jQuery的開源項目,可以在服務器端以jQuery的語法形式解析網(wǎng)頁元素。 相對于正則或其它方式匹配網(wǎng)頁方式,phpQuery使用起來要方便的多。
在使用phpQuery采集網(wǎng)頁時,遇到一個問題:在處理大量網(wǎng)頁之后,phpQuery占用的內(nèi)存數(shù)量非常驚人(很快就超過了1G),
比如這段代碼:
while (true) {
phpQuery::newDocumentFile($htmlFile);
// 處理網(wǎng)頁元素...
echo memory_get_usage() . "\n";
}
謹慎運行上面這段代碼,它會很快用光你的內(nèi)存。
經(jīng)過查看phpQuery的源代碼終于發(fā)現(xiàn)了問題所在,phpQuery在每處理一個網(wǎng)頁就會產(chǎn)生一個DOMDocumentWrapper 對象,而每個DOMDocumentWrapper 對象會被保存在靜態(tài)成員$documents中(phpQuery::createDocumentWrapper中),這個變量是一個數(shù)組,每解析一個網(wǎng)頁數(shù)組元素就增加一個。
phpQuery::$documents[$wrapper->id] = $wrapper;
找到問題后,解決就很容易了,每次解析完一個網(wǎng)頁,把phpQuery::$documents置空即可。
while (true) {
phpQuery::newDocumentFile($htmlFile);
// 處理網(wǎng)頁元素...
phpQuery::$documents = array();
echo memory_get_usage() . "\n";
}
內(nèi)存占用穩(wěn)定了。
在使用phpQuery采集網(wǎng)頁時,遇到一個問題:在處理大量網(wǎng)頁之后,phpQuery占用的內(nèi)存數(shù)量非常驚人(很快就超過了1G),
比如這段代碼:
復制代碼 代碼如下:
while (true) {
phpQuery::newDocumentFile($htmlFile);
// 處理網(wǎng)頁元素...
echo memory_get_usage() . "\n";
}
謹慎運行上面這段代碼,它會很快用光你的內(nèi)存。
經(jīng)過查看phpQuery的源代碼終于發(fā)現(xiàn)了問題所在,phpQuery在每處理一個網(wǎng)頁就會產(chǎn)生一個DOMDocumentWrapper 對象,而每個DOMDocumentWrapper 對象會被保存在靜態(tài)成員$documents中(phpQuery::createDocumentWrapper中),這個變量是一個數(shù)組,每解析一個網(wǎng)頁數(shù)組元素就增加一個。
phpQuery::$documents[$wrapper->id] = $wrapper;
找到問題后,解決就很容易了,每次解析完一個網(wǎng)頁,把phpQuery::$documents置空即可。
復制代碼 代碼如下:
while (true) {
phpQuery::newDocumentFile($htmlFile);
// 處理網(wǎng)頁元素...
phpQuery::$documents = array();
echo memory_get_usage() . "\n";
}
內(nèi)存占用穩(wěn)定了。
您可能感興趣的文章:
相關(guān)文章
php+MySQL判斷update語句是否執(zhí)行成功的方法
這篇文章主要介紹了php+MySQL判斷update語句是否執(zhí)行成功的方法,可以通過mysql_affected_rows方法加以實現(xiàn),需要的朋友可以參考下2014-08-08
PHP簡單實現(xiàn)合并2個數(shù)字鍵數(shù)組值的方法
這篇文章主要介紹了PHP簡單實現(xiàn)合并2個數(shù)字鍵數(shù)組值的方法,涉及php針對數(shù)組的遍歷、判斷、轉(zhuǎn)換等相關(guān)操作技巧,需要的朋友可以參考下2017-05-05

