淺析php插件 HTMLPurifier HTML解析器
更新時(shí)間:2013年07月01日 11:31:33 作者:
本篇文章是對php插件 HTMLPurifier HTML解析器進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下
HTMLPurifier插件的使用
下載HTMLPurifier插件
HTMLPurifier插件有用的部分是 library
<?php
require_once 'HTMLPurifier.auto.php';
$config = HTMLPurifier_Config::createDefault();
?>
或者
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
$config = HTMLPurifier_Config::createDefault();
?>
官網(wǎng)給出的例子是
require_once 'HTMLPurifier.auto.php';
我同事常用的是
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
設(shè)置$config
configdoc
http://htmlpurifier.org/live/configdoc/plain.html
例子
$config->set('HTML.AllowedElements', array('div'=>true, 'table'=>true, 'tr'=>true, 'td'=>true, 'br'=>true));
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional') //html文檔類型(常設(shè))
$config->set('Core.Encoding', 'UTF-8') //字符編碼(常設(shè))
HTML允許的元素
div元素,table元素,tr元素,td元素,br元素
new HTMLPurifier對象
$purifier = new HTMLPurifier($config);
調(diào)用HTMLPurifier對象的purify方法
$puri_html = $purifier->purify($html);
第二種方式
自定義一個(gè)類 HtmlPurifier.php
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
class Resume_HtmlPurifier implements Zend_Filter_Interface{
protected $_htmlPurifier = null;
public function __construct($options = null)
{
$config = HTMLPurifier_Config::createDefault();
$config->set('Code.Encoding', 'UTF-8');
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional')
if(!is_null($options)){
foreach($options as $option){
$config->set($option[0], $option[1], $option[2]);
}
}
$this->_htmlPurifier = new HTMLPurifier($config);
}
public function filter($value)
{
return $this->_htmlPurifier->purify($value);
}
}
?>
設(shè)置config信息
例如:
$conf = array(
array('HTML.AllowedElements',
array(
'div' => true,
'table' => true,
'tr' => true,
'td' => true,
'br' => true,
),
false), //允許屬性 div table tr td br元素
array('HTML.AllowedAttributes', array('class' => TRUE), false), //允許屬性 class
array('Attr.ForbiddenClasses', array('resume_p' => TRUE), false), //禁止classes如
array('AutoFormat.RemoveEmpty', true, false), //去空格
array('AutoFormat.RemoveEmpty.RemoveNbsp', true, false), //去nbsp
array('URI.Disable', true, false),
);
調(diào)用
$p = new Resume_HtmlPurifier($conf);
$puri_html = $p->filter($html);
下載HTMLPurifier插件
HTMLPurifier插件有用的部分是 library

使用HTMLPurifier library類庫
第一種方式
復(fù)制代碼 代碼如下:
<?php
require_once 'HTMLPurifier.auto.php';
$config = HTMLPurifier_Config::createDefault();
?>
或者
復(fù)制代碼 代碼如下:
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
$config = HTMLPurifier_Config::createDefault();
?>
官網(wǎng)給出的例子是
復(fù)制代碼 代碼如下:
require_once 'HTMLPurifier.auto.php';
我同事常用的是
復(fù)制代碼 代碼如下:
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
設(shè)置$config
configdoc
http://htmlpurifier.org/live/configdoc/plain.html
例子
復(fù)制代碼 代碼如下:
$config->set('HTML.AllowedElements', array('div'=>true, 'table'=>true, 'tr'=>true, 'td'=>true, 'br'=>true));
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional') //html文檔類型(常設(shè))
$config->set('Core.Encoding', 'UTF-8') //字符編碼(常設(shè))
HTML允許的元素
div元素,table元素,tr元素,td元素,br元素
new HTMLPurifier對象
復(fù)制代碼 代碼如下:
$purifier = new HTMLPurifier($config);
調(diào)用HTMLPurifier對象的purify方法
復(fù)制代碼 代碼如下:
$puri_html = $purifier->purify($html);
第二種方式
自定義一個(gè)類 HtmlPurifier.php
復(fù)制代碼 代碼如下:
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
class Resume_HtmlPurifier implements Zend_Filter_Interface{
protected $_htmlPurifier = null;
public function __construct($options = null)
{
$config = HTMLPurifier_Config::createDefault();
$config->set('Code.Encoding', 'UTF-8');
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional')
if(!is_null($options)){
foreach($options as $option){
$config->set($option[0], $option[1], $option[2]);
}
}
$this->_htmlPurifier = new HTMLPurifier($config);
}
public function filter($value)
{
return $this->_htmlPurifier->purify($value);
}
}
?>
設(shè)置config信息
例如:
復(fù)制代碼 代碼如下:
$conf = array(
array('HTML.AllowedElements',
array(
'div' => true,
'table' => true,
'tr' => true,
'td' => true,
'br' => true,
),
false), //允許屬性 div table tr td br元素
array('HTML.AllowedAttributes', array('class' => TRUE), false), //允許屬性 class
array('Attr.ForbiddenClasses', array('resume_p' => TRUE), false), //禁止classes如
array('AutoFormat.RemoveEmpty', true, false), //去空格
array('AutoFormat.RemoveEmpty.RemoveNbsp', true, false), //去nbsp
array('URI.Disable', true, false),
);
調(diào)用
復(fù)制代碼 代碼如下:
$p = new Resume_HtmlPurifier($conf);
$puri_html = $p->filter($html);
您可能感興趣的文章:
- PHP解析html類庫simple_html_dom的轉(zhuǎn)碼bug
- php解析html類庫simple_html_dom(詳細(xì)介紹)
- 淺析php插件 Simple HTML DOM 用DOM方式處理HTML
- PHP simple_html_dom.php+正則 采集文章代碼
- WordPress中轉(zhuǎn)義HTML與過濾鏈接的相關(guān)PHP函數(shù)使用解析
- php基于Snoopy解析網(wǎng)頁html的方法
- PHP抓取網(wǎng)頁、解析HTML常用的方法總結(jié)
- php實(shí)現(xiàn)的一個(gè)很好用HTML解析器類可用于采集數(shù)據(jù)
- 解析關(guān)于java,php以及html的所有文件編碼與亂碼的處理方法匯總
- 解析PHP生成靜態(tài)html文件的三種方法
- 用php解析html的實(shí)現(xiàn)代碼
- php使用simple_html_dom解析HTML示例
相關(guān)文章
php中0,null,empty,空,false,字符串關(guān)系的詳細(xì)介紹
本篇文章是對php中0,null,empty,空,false,字符串關(guān)系進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-06-06
PHP使用puppeteer抓取JS渲染后的頁面內(nèi)容
最近遇到一個(gè)問題,需要爬取js渲染后的網(wǎng)頁內(nèi)容,因此研究了下相關(guān)實(shí)現(xiàn)方式,主要借助puppeteer實(shí)現(xiàn),它是一個(gè)Node庫,要想在PHP中使用,還借助了spatie/browsershot2025-02-02
php封裝的pdo數(shù)據(jù)庫操作工具類與用法示例
這篇文章主要介紹了php封裝的pdo數(shù)據(jù)庫操作工具類與用法,結(jié)合實(shí)例形式分析了php封裝的pdo數(shù)據(jù)庫連接、增刪改查、錯(cuò)誤處理、關(guān)閉連接等操作及相關(guān)使用技巧,需要的朋友可以參考下2019-05-05
基于PHPexecl類生成復(fù)雜的報(bào)表表頭示例
這篇文章主要介紹了基于PHPexecl類生成復(fù)雜的報(bào)表表頭功能,結(jié)合實(shí)例形式分析了實(shí)例化PHPexecl類生成復(fù)雜報(bào)表表頭的具體步驟與相關(guān)操作技巧,需要的朋友可以參考下2016-10-10
php中數(shù)字、字符與對象判斷函數(shù)用法實(shí)例
這篇文章主要介紹了php中數(shù)字、字符與對象判斷函數(shù)用法,以實(shí)例形式分析了is_bool()、is_int()、is_integer()、is_float()、is_real()、is_object() 和 is_array()等函數(shù)的作用及具體用法,需要的朋友可以參考下2014-11-11
PHP中通過加號合并數(shù)組的一個(gè)簡單方法分享
通常,我們合并多個(gè)數(shù)組用的是array_merge()函數(shù),其實(shí),PHP手冊中關(guān)于數(shù)組操作符的介紹給了我們更簡單的方法,那就是"+"號,看看下面的例子就明白了(詳細(xì)了解)
2011-01-01
php實(shí)現(xiàn)curl模擬ftp上傳的方法
這篇文章主要介紹了php實(shí)現(xiàn)curl模擬ftp上傳的方法,實(shí)例分析了php基于curl實(shí)現(xiàn)FTP傳輸文件的相關(guān)技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下
2015-07-07 
