您所在的位置:小祥子 » 编程 » ASP » 正文

ASP正则表达式去掉指定HTML标记

时间:2015-02-10 编辑:本站 来源:本站原创

两个方法去掉指定的HTML标记,第一个是正则匹配的方法,第二个是进行替换哪些标记的方法

Function   ReplaceHtml(patrn,   strng,content)  
   If  IsNull(content)   Then  
     content=""  
   End  If  
   Set   regEx   =   New   RegExp '   建立正则表达式。  
   regEx.Pattern   =   patrn '   设置模式。  
   regEx.IgnoreCase   =   true             '   设置忽略字符大小写。  
   regEx.Global   =   True '   设置全局可用性。  
   ReplaceHtml=regEx.Replace(content,strng) '   执行正则匹配  
End   Function

Function   ClearHtml(Content)  
   Content=ReplaceHtml("&#[^>]*;",   "",   Content)  
   Content=ReplaceHtml("</?marquee[^>]*>",   "",   Content)  
   Content=ReplaceHtml("</?object[^>]*>",   "",   Content)  
   Content=ReplaceHtml("</?param[^>]*>",   "",   Content)  
   Content=ReplaceHtml("</?embed[^>]*>",   "",   Content)  
   Content=ReplaceHtml("</?table[^>]*>",   "",   Content)  
   Content=ReplaceHtml(" ","",Content)  
   Content=ReplaceHtml("</?tr[^>]*>",   "",   Content)  
   Content=ReplaceHtml("</?th[^>]*>","",Content)  
   Content=ReplaceHtml("</?p[^>]*>","",Content)  
   Content=ReplaceHtml("</?a[^>]*>","",Content)  
   Content=ReplaceHtml("</?img[^>]*>","",Content)  
   Content=ReplaceHtml("</?tbody[^>]*>","",Content)  
   Content=ReplaceHtml("</?li[^>]*>","",Content)  
   Content=ReplaceHtml("</?span[^>]*>","",Content)  
   Content=ReplaceHtml("</?div[^>]*>","",Content)  
   Content=ReplaceHtml("</?th[^>]*>",   "",   Content)  
   Content=ReplaceHtml("</?td[^>]*>",   "",   Content)
   Content=ReplaceHtml("</?script[^>]*>",   "",   Content)  
   Content=ReplaceHtml("(javascript|JScript|vbscript|vbs):",   "",   Content)  
   Content=ReplaceHtml("on(mouse|exit|error|click|key)",   "",   Content)  
   Content=ReplaceHtml("<\\?xml[^>]*>",   "",   Content)  
   Content=ReplaceHtml("<\/?[a-z]+:[^>]*>",   "",   Content)  
   Content=ReplaceHtml("</?font[^>]*>",   "",   Content)  
   Content=ReplaceHtml("</?b[^>]*>","",Content)  
   Content=ReplaceHtml("</?u[^>]*>","",Content)  
   Content=ReplaceHtml("</?i[^>]*>","",Content)  
   Content=ReplaceHtml("</?strong[^>]*>","",Content)  
  ' Content=ReplaceHtml("  ","",Content)
   ClearHtml=Content  
End   Function