用PHP代替JS玩轉DOM的思路及示例代碼

更新時間：2014年06月15日 17:21:29 投稿：whsnow

思路就是通過DOMDocument將一個html file轉換成DOM樹的數(shù)據(jù)結構，再用DOMXPath的實例去搜索這個DOM樹，接下來就可以對當前節(jié)點的子樹進行遍歷

事情的起源比較簡單，我需要把一個導航頁的數(shù)據(jù)整理好寫入數(shù)據(jù)庫。一個比較直觀的方法是對html文件進行分析，通用的方法是用php的正則表達式來匹配。但是這樣做開發(fā)和維護都很困難，代碼可讀性非常差。

導航頁的數(shù)據(jù)都是規(guī)則的排列在DOM樹當中的，用JS可以用幾個循環(huán)輕松的對其進行操作，而且JS需要依賴瀏覽器，操作數(shù)據(jù)庫很困難。其實PHP就有現(xiàn)成的類庫對DOM樹種的節(jié)點進行增刪改查操作，在此做一些筆記。

這里涉及到2個類 DOMDocument 和 DOMXPath。

其實思路比較明確，就是通過DOMDocument將一個html file轉換成DOM樹的數(shù)據(jù)結構，再用DOMXPath的實例去搜索這個DOM樹，拿到想要特定節(jié)點，接下來就可以對當前節(jié)點的子樹進行遍歷，得到想要的結果。

在當前目錄下有一個這樣一個導航的html文件 "./hao.html"

現(xiàn)在需要得到所有<a>標簽的中文內容，php代碼如下：

復制代碼代碼如下:

 
<?php 
//將html/xml文件轉換成DOM樹 
$dom = new DOMDocument(); 
$dom->loadHTMLFile("hao.html"); 

//得到所有class為fix的dl標簽 

// example 1: for everything with an id 
//$elements = $xpath->query("http://*[@id]"); 

// example 2: for node data in a selected id 
//$elements = $xpath->query("/html/body/div[@id='yourTagIdHere']"); 

// example 3: same as above with wildcard 
//$elements = $xpath->query("*/div[@id='yourTagIdHere']"); 
$xpath = new DOMXPath($dom); 
$dls = $xpath->query('//dl[@class="fix"]'); 

foreach ($dls as $dl) { 
$spans = $dl->childNodes; 
foreach ($spans as $span) { 
echo trim($span->textContent)."\t"; 
} 
echo "\n"; 
} 
?> 

輸出結果如下：

注意：值得注意的一點是DOMDocument的默認編碼方式是Latin，所以在處理utf編碼的中文的時候，需要在<head>后面緊跟著填入

復制代碼代碼如下:

在其他位置，或者是只寫上<meta content="charset=utf-8">都是不識別的哦

PHP setcookie設置Cookie用法(及設置無效的問題)
平時用Session比較多，很少用到Cookie，這次是為了解決Discuz!自動同步登陸不得不用Cookie。
2011-07-07
php安裝dblib擴展,連接mssql的具體步驟
下面小編就為大家?guī)硪黄猵hp安裝dblib擴展,連接mssql的具體步驟。小編覺得挺不錯的，現(xiàn)在就分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2017-03-03
php+html5使用FormData對象提交表單及上傳圖片的方法
這篇文章主要介紹了php+html5使用FormData對象提交表單及上傳圖片的方法,實例分析了FormData對象的使用技巧,非常具有實用價值,需要的朋友可以參考下
2015-02-02
使用php+Ajax實現(xiàn)唯一校驗實現(xiàn)代碼[簡單應用]
使用php+Ajax實現(xiàn)唯一校驗實現(xiàn)代碼[簡單應用],前臺用ajax后臺用php，需要的朋友可以參考下。
2011-11-11
PHP實現(xiàn)基于mysqli的Model基類完整實例
這篇文章主要介紹了PHP實現(xiàn)基于mysqli的Model基類,給出了數(shù)據(jù)庫基類的完整實現(xiàn)與使用方法,需要的朋友可以參考下
2016-04-04
php導出生成word的方法
這篇文章主要介紹了php導出生成word的方法,結合實例形式分析了php查詢數(shù)據(jù)庫及導出生成word文檔的具體步驟與相關技巧,需要的朋友可以參考下
2015-12-12
實現(xiàn)PHP多線程異步請求的3種方法
實現(xiàn)PHP多線程異步請求的方法有很多，在本文整理了3種不多的常用方法，大家可以參考下
2014-01-01
使用php判斷網(wǎng)頁是否gzip壓縮
本篇文章是對使用php判斷網(wǎng)頁是否gzip壓縮進行了詳細的分析介紹，需要的朋友參考下
2013-06-06
PHP中調用C/C++制作的動態(tài)鏈接庫的教程
這篇文章主要介紹了PHP中調用C/C++制作的動態(tài)鏈接庫的教程,文中還簡單地提到了gcc編譯器下動態(tài)鏈接庫的制作方法,需要的朋友可以參考下
2016-03-03
PHP Static延遲靜態(tài)綁定用法分析
這篇文章主要介紹了PHP Static延遲靜態(tài)綁定用法,結合實例形式較為詳細的分析了Static延遲靜態(tài)綁定的功能,定義及使用技巧,需要的朋友可以參考下
2016-03-03