C#使用正則表達(dá)式過濾html標(biāo)簽
更新時間:2016年08月19日 09:12:28 作者:WeihanLi
最近在開發(fā)一個項目,其中有需求要求我們把一段html轉(zhuǎn)換為一般文本返回,使用正則表達(dá)式是明智的選擇,下面小編給介紹下C#使用正則表達(dá)式過濾html標(biāo)簽,需要的朋友參考下
在項目中遇到這樣一個需求,需要將一段html轉(zhuǎn)換為一般文本返回,萬能的正則表達(dá)式來了。
正則表達(dá)式來拯救你,代碼如下:
public static string Html2Text(string htmlStr)
{
if (String.IsNullOrEmpty(htmlStr))
{
return "";
}
string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; //定義style的正則表達(dá)式
string regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; //定義script的正則表達(dá)式
string regEx_html = "<[^>]+>"; //定義HTML標(biāo)簽的正則表達(dá)式
htmlStr = Regex.Replace(htmlStr, regEx_style, "");//刪除css
htmlStr = Regex.Replace(htmlStr, regEx_script, "");//刪除js
htmlStr = Regex.Replace(htmlStr, regEx_html, "");//刪除html標(biāo)記
htmlStr = Regex.Replace(htmlStr, "\\s*|\t|\r|\n", "");//去除tab、空格、空行
htmlStr = htmlStr.Replace(" ", "");
htmlStr = htmlStr.Replace(""", "");//去除異常的引號" " "
htmlStr = htmlStr.Replace(""", "");
return htmlStr.Trim();
}

以上所述是小編給大家介紹的C#使用正則表達(dá)式過濾html標(biāo)簽 ,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關(guān)文章
C#把數(shù)組中的某個元素取出來放到第一個位置的實現(xiàn)方法
這篇文章主要介紹了C#把數(shù)組中的某個元素取出來放到第一個位置的實現(xiàn)方法,涉及C#針對數(shù)組的常見操作技巧,非常具有實用價值,需要的朋友可以參考下2014-12-12
C#多線程同步:Mutex與Semaphore的區(qū)別及使用場景詳解
這篇文章主要介紹了C#多線程同步:Mutex與Semaphore的區(qū)別及使用場景,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2025-03-03
C#自定義DataGridViewColumn顯示TreeView
我們可以自定義DataGridView的DataGridViewColumn來實現(xiàn)自定義的列,下面介紹一下如何通過擴(kuò)展DataGridViewColumn來實現(xiàn)一個TreeViewColumn2015-12-12

