|
正则表达式再次让我震撼,寥寥数行代码就可以完成普通代码不易实现的功能,至少是实现起来比较复杂的功能。
一、清楚内容中的Javsscript 代码
1 Function ClearJSCode(originCode) 2 3 Dim reg 4 5 set reg = New RegExp 6 7 reg.Pattern = <SCRIPT[^<]*</SCRIPT> 8 reg.IgnoreCase = True 9 reg.Global = True 10 11 clearJSCode = reg.Replace(originCode, ) 12 13 End Function 14
二、清除内容中的HTML代码
1 Function ClearHTMLCode(originCode) 2 3 Dim reg 4 set reg = new RegExp 5 6 reg.Pattern = <[^>]*> 7 reg.IgnoreCase = True 8 reg.Global = True 9 10 ClearHTMLCode = reg.Replace(originCode, ) 11 12 End Function 13
现在好多网站的内容都是使用采集程序生成的,使用上边的代码就可以轻松的将内容中的HTML和JS代码清除掉。
正则表达式的威力--轻松消除HTML代码_asp.net教程_www.it958.cn |