ASP超級鏈接和HTML函數(shù)正則表達(dá)式 修正版
更新時間:2010年01月02日 12:20:34 作者:
ASP超級鏈接和HTML函數(shù) 正則表達(dá)式的使用,最后一個實例經(jīng)過測試。
過濾超級鏈接
Function RegRemoveHref(HTMLstr)
Set ra = New RegExp
ra.IgnoreCase = True
ra.Global = True
ra.Pattern = "<A[^>]+>(.+?)<\/A>"
RegRemoveHref = ra.replace(HTMLstr,"$1")
END Function
過濾所有HTML代碼
Function RemoveHTML(strHTML)
Dim objRegExp, Match, Matches
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
'取閉合的<>
objRegExp.Pattern = "<.+?>"
'進(jìn)行匹配
Set Matches = objRegExp.Execute(strHTML)
' 遍歷匹配集合,并替換掉匹配的項目
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
RemoveHTML=strHTML
Set objRegExp = Nothing
End Function
過濾所有HTML代碼 和空格換行
Function RemoveHTML(strHTML)
Dim objRegExp, Match, Matches
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
objRegExp.Pattern = "<.+?>"
'objRegExp.Pattern = "(\r|\n|\r\n| |\t| )"
Set Matches = objRegExp.Execute(strHTML)
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
objRegExp.Pattern = "(\r|\n|\r\n| |\t| )"
Set Matches = objRegExp.Execute(strHTML)
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
RemoveHTML=strHTML
Set objRegExp = Nothing
End Function
asp使用正則表達(dá)式去除script代碼和HTML代碼
一、清楚內(nèi)容中的Javsscript 代碼 這個代碼的作用是去掉用<script </script>標(biāo)記包含的所有部分。
根據(jù)實際需要,它也許不能滿足要求。如果用在屏蔽客戶提交代碼的地方,應(yīng)保證這一步在最后執(zhí)行。
很多人還會拼湊這樣的標(biāo)記,應(yīng)小心。
Function ClearJSCode(originCode)
Dim reg
set reg = New RegExp
reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
reg.IgnoreCase = True
reg.Global = True
clearJSCode = reg.Replace(originCode, "")
End Function
二、清除內(nèi)容中的HTML代碼
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.Pattern = "<[^>]*>"
reg.IgnoreCase = True
reg.Global = True
ClearHTMLCode = reg.Replace(originCode, "")
End Function
<js jsid="1" jsname="去除內(nèi)容頁里干擾信息"><![CDATA[
var sourcehtml=function(){/*%s*/}.toString().slice(13, -3);
parser9527=function()
{
var ss=sourcehtml;
ss=ss.replace(/<.*?>/ig,"");
ss=ss.replace(/(\r|\n|\r\n| |\t| )/ig,"");
ss=ss.replace(/(<\/a>)/ig,"");
ss=ss.replace(/<a((.|\n)*?)>/ig,"");
ss=ss.replace("_網(wǎng)易新聞中心","");
/*
ss=ss.replace(/<iframe((.|\n)*?)<\/iframe>/ig,"");
ss=ss.replace(/<script((.|\n)*?)<\/script>/ig,"");
ss=ss.replace(/<address((.|\n)*?)<\/address>/ig,"");
ss=ss.replace(/(<\/a>)/ig,"");
ss=ss.replace(/<a((.|\n)*?)>/ig,"");
ss=ss.replace(/<SELECT((.|\n)*?)<\/SELECT>/ig,"");
ss=ss.replace(/<TABLE((.|\n)*?)<\/TABLE>/ig,"");
ss=ss.replace(/<img((.|\n)*?)>/ig,"");
ss=ss.replace(/<TABLE((.|\n)*?)>/ig,"");
ss=ss.replace(/(<\/TABLE>)/ig,"");
ss=ss.replace(/<TR((.|\n)*?)>/ig,"<BR>");
ss=ss.replace(/(<\/TR>)/ig,"");
ss=ss.replace(/<nobr((.|\n)*?)>/ig,"<BR>");
ss=ss.replace(/<nobr((.|\n)*?)>/ig,"");
ss=ss.replace(/(<\/nobr>)/ig,"");
ss=ss.replace(/<TD((.|\n)*?)>/ig," ");
ss=ss.replace(/(<\/TD>)/ig,"");
ss=ss.replace(/<span id=((.|\n)*?)<\/small>/ig,"");
ss=ss.replace(/<div((.|\n)*?)>/ig,"");
ss=ss.replace(/(<\/div>)/ig,"");
*/
return ss;
}
parser9527();
]]></js>
ASP常用的正則過濾函數(shù) 可過濾html js style div font
開發(fā)程序,經(jīng)常要用到正則表達(dá)式進(jìn)行過濾一些不需要的東西,比如html js style div font,有時候需要過濾極個別的,有時候需要過濾好幾種,不管怎么過濾,萬變不離其宗。
這是我收藏的一些過濾函數(shù),可以用來過濾您不需要的代碼。如果需要過濾多種,可以嵌套使用,也可以自己整合代碼。不過不建議嵌套使用,因為那樣效率太低。
Asp 正則表達(dá)式 過濾 所有 html 標(biāo)記 :
Function LoseHtml(ContentStr)
Dim ClsTempLoseStr,regEx
ClsTempLoseStr = Cstr(ContentStr)
Set regEx = New RegExp
regEx.Pattern = "<\/*[^<>]*>"
regEx.IgnoreCase = True
regEx.Global = True
ClsTempLoseStr = regEx.Replace(ClsTempLoseStr,"")
LoseHtml = ClsTempLoseStr
End function
Asp 正則表達(dá)式 過濾 style 標(biāo)記 :
regEx.Pattern = "(<style)+[^<>]*>[^\0]*(<\/style>)+"
Asp 正則表達(dá)式 過濾 層 div 標(biāo)記 :
regEx.Pattern = "<(\/){0,1}div[^<>]*>"
Asp 正則表達(dá)式 過濾 鏈接 a 標(biāo)記 :
regEx.Pattern = "<(\/){0,1}a[^<>]*>"
Asp 正則表達(dá)式 過濾 字體 font 標(biāo)記 :
regEx.Pattern = "<(\/){0,1}font[^<>]*>"
Asp 正則表達(dá)式 過濾 span 標(biāo)記 :
regEx.Pattern = "<(\/){0,1}span[^<>]*>"
Asp 正則表達(dá)式 過濾 object 標(biāo)記 :
regEx.Pattern = "<object.*?/object>"
Asp 正則表達(dá)式 過濾 iframe 標(biāo)記:
regEx.Pattern = "(<iframe){1,}[^<>]*>[^\0]*(<\/iframe>){1,}"
Asp 正則表達(dá)式 過濾 script :
regEx.Pattern = "(<script){1,}[^<>]*>[^\0]*(<\/script>){1,}"
Asp 正則表達(dá)式 過濾 Class 標(biāo)記 :
regEx.Pattern = "(class=){1,}(""|\'){0,1}\S+(""|\'|>|\s){0,1}"
字符串替換 Replace 的正則表達(dá)式 :
<%
Function ReplaceReg(str,patrn,replStr,Ignor)
'=========================================
'參數(shù)解釋:
'str 原來的字符串
'patrn 要替換的字符串(正則表達(dá)式)
'replStr 要替換成的字符串
'Ignor 是否區(qū)分大小寫(1不區(qū)分,0區(qū)分)
'=========================================
Dim regEx ' 建立變量。
If Ingor=1 Then Ingor=true else Ingor=false
Set regEx = New RegExp ' 建立正則表達(dá)式。
regEx.Pattern = patrn ' 設(shè)置模式。
regEx.IgnoreCase = Ignor ' 設(shè)置是否區(qū)分大小寫。
regEx.Global=True
ReplaceReg = regEx.Replace(str,replStr) ' 作替換。
End Function
'例如 將 www.xxx.com 替換成 <a href="http://www.dhdzp.com">www.dhdzp.com</a>
Response.Write(ReplaceReg("腳本之家www.xxx.com","www\.xxx\.com","<a href=""http://www.dhdzp.com"">www.dhdzp.com</a>",1))
%>
復(fù)制代碼 代碼如下:
Function RegRemoveHref(HTMLstr)
Set ra = New RegExp
ra.IgnoreCase = True
ra.Global = True
ra.Pattern = "<A[^>]+>(.+?)<\/A>"
RegRemoveHref = ra.replace(HTMLstr,"$1")
END Function
過濾所有HTML代碼
復(fù)制代碼 代碼如下:
Function RemoveHTML(strHTML)
Dim objRegExp, Match, Matches
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
'取閉合的<>
objRegExp.Pattern = "<.+?>"
'進(jìn)行匹配
Set Matches = objRegExp.Execute(strHTML)
' 遍歷匹配集合,并替換掉匹配的項目
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
RemoveHTML=strHTML
Set objRegExp = Nothing
End Function
過濾所有HTML代碼 和空格換行
復(fù)制代碼 代碼如下:
Function RemoveHTML(strHTML)
Dim objRegExp, Match, Matches
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
objRegExp.Pattern = "<.+?>"
'objRegExp.Pattern = "(\r|\n|\r\n| |\t| )"
Set Matches = objRegExp.Execute(strHTML)
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
objRegExp.Pattern = "(\r|\n|\r\n| |\t| )"
Set Matches = objRegExp.Execute(strHTML)
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
RemoveHTML=strHTML
Set objRegExp = Nothing
End Function
asp使用正則表達(dá)式去除script代碼和HTML代碼
一、清楚內(nèi)容中的Javsscript 代碼 這個代碼的作用是去掉用<script </script>標(biāo)記包含的所有部分。
根據(jù)實際需要,它也許不能滿足要求。如果用在屏蔽客戶提交代碼的地方,應(yīng)保證這一步在最后執(zhí)行。
很多人還會拼湊這樣的標(biāo)記,應(yīng)小心。
復(fù)制代碼 代碼如下:
Function ClearJSCode(originCode)
Dim reg
set reg = New RegExp
reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
reg.IgnoreCase = True
reg.Global = True
clearJSCode = reg.Replace(originCode, "")
End Function
二、清除內(nèi)容中的HTML代碼
復(fù)制代碼 代碼如下:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.Pattern = "<[^>]*>"
reg.IgnoreCase = True
reg.Global = True
ClearHTMLCode = reg.Replace(originCode, "")
End Function
復(fù)制代碼 代碼如下:
<js jsid="1" jsname="去除內(nèi)容頁里干擾信息"><![CDATA[
var sourcehtml=function(){/*%s*/}.toString().slice(13, -3);
parser9527=function()
{
var ss=sourcehtml;
ss=ss.replace(/<.*?>/ig,"");
ss=ss.replace(/(\r|\n|\r\n| |\t| )/ig,"");
ss=ss.replace(/(<\/a>)/ig,"");
ss=ss.replace(/<a((.|\n)*?)>/ig,"");
ss=ss.replace("_網(wǎng)易新聞中心","");
/*
ss=ss.replace(/<iframe((.|\n)*?)<\/iframe>/ig,"");
ss=ss.replace(/<script((.|\n)*?)<\/script>/ig,"");
ss=ss.replace(/<address((.|\n)*?)<\/address>/ig,"");
ss=ss.replace(/(<\/a>)/ig,"");
ss=ss.replace(/<a((.|\n)*?)>/ig,"");
ss=ss.replace(/<SELECT((.|\n)*?)<\/SELECT>/ig,"");
ss=ss.replace(/<TABLE((.|\n)*?)<\/TABLE>/ig,"");
ss=ss.replace(/<img((.|\n)*?)>/ig,"");
ss=ss.replace(/<TABLE((.|\n)*?)>/ig,"");
ss=ss.replace(/(<\/TABLE>)/ig,"");
ss=ss.replace(/<TR((.|\n)*?)>/ig,"<BR>");
ss=ss.replace(/(<\/TR>)/ig,"");
ss=ss.replace(/<nobr((.|\n)*?)>/ig,"<BR>");
ss=ss.replace(/<nobr((.|\n)*?)>/ig,"");
ss=ss.replace(/(<\/nobr>)/ig,"");
ss=ss.replace(/<TD((.|\n)*?)>/ig," ");
ss=ss.replace(/(<\/TD>)/ig,"");
ss=ss.replace(/<span id=((.|\n)*?)<\/small>/ig,"");
ss=ss.replace(/<div((.|\n)*?)>/ig,"");
ss=ss.replace(/(<\/div>)/ig,"");
*/
return ss;
}
parser9527();
]]></js>
ASP常用的正則過濾函數(shù) 可過濾html js style div font
開發(fā)程序,經(jīng)常要用到正則表達(dá)式進(jìn)行過濾一些不需要的東西,比如html js style div font,有時候需要過濾極個別的,有時候需要過濾好幾種,不管怎么過濾,萬變不離其宗。
這是我收藏的一些過濾函數(shù),可以用來過濾您不需要的代碼。如果需要過濾多種,可以嵌套使用,也可以自己整合代碼。不過不建議嵌套使用,因為那樣效率太低。
Asp 正則表達(dá)式 過濾 所有 html 標(biāo)記 :
復(fù)制代碼 代碼如下:
Function LoseHtml(ContentStr)
Dim ClsTempLoseStr,regEx
ClsTempLoseStr = Cstr(ContentStr)
Set regEx = New RegExp
regEx.Pattern = "<\/*[^<>]*>"
regEx.IgnoreCase = True
regEx.Global = True
ClsTempLoseStr = regEx.Replace(ClsTempLoseStr,"")
LoseHtml = ClsTempLoseStr
End function
Asp 正則表達(dá)式 過濾 style 標(biāo)記 :
regEx.Pattern = "(<style)+[^<>]*>[^\0]*(<\/style>)+"
Asp 正則表達(dá)式 過濾 層 div 標(biāo)記 :
regEx.Pattern = "<(\/){0,1}div[^<>]*>"
Asp 正則表達(dá)式 過濾 鏈接 a 標(biāo)記 :
regEx.Pattern = "<(\/){0,1}a[^<>]*>"
Asp 正則表達(dá)式 過濾 字體 font 標(biāo)記 :
regEx.Pattern = "<(\/){0,1}font[^<>]*>"
Asp 正則表達(dá)式 過濾 span 標(biāo)記 :
regEx.Pattern = "<(\/){0,1}span[^<>]*>"
Asp 正則表達(dá)式 過濾 object 標(biāo)記 :
regEx.Pattern = "<object.*?/object>"
Asp 正則表達(dá)式 過濾 iframe 標(biāo)記:
regEx.Pattern = "(<iframe){1,}[^<>]*>[^\0]*(<\/iframe>){1,}"
Asp 正則表達(dá)式 過濾 script :
regEx.Pattern = "(<script){1,}[^<>]*>[^\0]*(<\/script>){1,}"
Asp 正則表達(dá)式 過濾 Class 標(biāo)記 :
regEx.Pattern = "(class=){1,}(""|\'){0,1}\S+(""|\'|>|\s){0,1}"
字符串替換 Replace 的正則表達(dá)式 :
復(fù)制代碼 代碼如下:
<%
Function ReplaceReg(str,patrn,replStr,Ignor)
'=========================================
'參數(shù)解釋:
'str 原來的字符串
'patrn 要替換的字符串(正則表達(dá)式)
'replStr 要替換成的字符串
'Ignor 是否區(qū)分大小寫(1不區(qū)分,0區(qū)分)
'=========================================
Dim regEx ' 建立變量。
If Ingor=1 Then Ingor=true else Ingor=false
Set regEx = New RegExp ' 建立正則表達(dá)式。
regEx.Pattern = patrn ' 設(shè)置模式。
regEx.IgnoreCase = Ignor ' 設(shè)置是否區(qū)分大小寫。
regEx.Global=True
ReplaceReg = regEx.Replace(str,replStr) ' 作替換。
End Function
'例如 將 www.xxx.com 替換成 <a href="http://www.dhdzp.com">www.dhdzp.com</a>
Response.Write(ReplaceReg("腳本之家www.xxx.com","www\.xxx\.com","<a href=""http://www.dhdzp.com"">www.dhdzp.com</a>",1))
%>
您可能感興趣的文章:
- ASP中過濾UBB和Html標(biāo)簽
- HTML標(biāo)簽及ASP函數(shù)速查表
- ASP.NET使用正則表達(dá)式屏蔽垃圾信息
- ASP正則表達(dá)式技巧
- ASP 正則表達(dá)式常用的幾種方法(execute、test、replace)
- asp 使用正則表達(dá)式替換word中的標(biāo)簽,轉(zhuǎn)為純文本
- asp.net正則表達(dá)式刪除指定的HTML標(biāo)簽的代碼
- asp正則表達(dá)式使用詳解
- asp的RegExp對象正則表達(dá)式功能用法[比較全]
- 正則表達(dá)式速查表(ASP.NET)
- asp自動補(bǔ)全html標(biāo)簽自動閉合(正則表達(dá)式)
- ASP正則表達(dá)式清除HTML指定標(biāo)簽的方法
相關(guān)文章
javascript將字符串中的多個空格替換為一個空格的正則實例
這篇文章主要介紹了javascript將字符串中的多個空格替換為一個空格的正則實例,需要的朋友可以參考下2016-12-12
Hive中常用正則表達(dá)式的運(yùn)用小結(jié)
在實際的應(yīng)用中,通常需要在一些復(fù)雜的、沒有規(guī)律的字符串中提取數(shù)據(jù),這時候就需要用到正則表達(dá)式了,這次講一下hive的正則表達(dá)式,感興趣的朋友跟隨小編一起看看吧2022-08-08
通過Java正則表達(dá)式去掉SQL代碼中回車換行和多余空格
剛才在寫一個代碼工具,遇到SQL換行和多余空格的問題,導(dǎo)致處理很困難,于是寫了一個正則式,搞定了,特分享下方便需要的朋友2012-09-09
使用正則表達(dá)式生成隨機(jī)數(shù)據(jù)的方法
這篇文章主要介紹了使用正則表達(dá)式生成隨機(jī)數(shù)據(jù)的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-02-02
c# 正則表達(dá)式對網(wǎng)頁進(jìn)行有效內(nèi)容抽取
本問主要總結(jié)了用正則表達(dá)式對網(wǎng)頁進(jìn)行有效內(nèi)容提取的具體實現(xiàn)方法,并給出了c#代碼2009-03-03

