网络编程 
首页 > 网络编程 > 浏览文章

去html代码的正则 推荐

(编辑:jimmy 日期: 2024/11/18 浏览:3 次 )
复制代码 代码如下:
'==================================================
'函数名:ScriptHtml
'作  用:过滤html标记
'参  数:ConStr ------ 要过滤的字符串
'==================================================
Function ScriptHtml(Byval ConStr,TagName,FType)
    Dim Re
    Set Re=new RegExp
    Re.IgnoreCase =true
    Re.Global=True
    Select Case FType
    Case 1
       Re.Pattern="<" & TagName & "([^>])*>"
       ConStr=Re.Replace(ConStr,"")
    Case 2
       Re.Pattern="<" & TagName & "([^>])*>.*?</" & TagName & "([^>])*>"
       ConStr=Re.Replace(ConStr,"")
    Case 3
       Re.Pattern="<" & TagName & "([^>])*>"
       ConStr=Re.Replace(ConStr,"")
       Re.Pattern="</" & TagName & "([^>])*>"
       ConStr=Re.Replace(ConStr,"")
    End Select
    ScriptHtml=ConStr
    Set Re=Nothing
End Function

1 content=ScriptHtml(content,"br",1) ‘去掉所有<br>HTML标记

2 content=ScriptHtml(content,"a",2) ‘去掉所有<a></a>和两个标记之间的内容 
如  <a href=www.126.com>www.126.com</a>  把这一段全去了

3  content=ScriptHtml(content,"td",3) ‘去掉<td>和</td>HTML标记
如  <td>士大夫撒</td>  把<td> </td> 去掉了 但士大夫撒还保留

依次类推把其他HTML标记都过滤了 div objdect什么的 自己看吧
上一篇:正则表达式的应用
下一篇:正则表达式的使用 ASP