快精灵印艺坊 您身边的文印专家
广州名片 深圳名片 会员卡 贵宾卡 印刷 设计教程
产品展示 在线订购 会员中心 产品模板 设计指南 在线编辑
 首页 名片设计   CorelDRAW   Illustrator   AuotoCAD   Painter   其他软件   Photoshop   Fireworks   Flash  

 » 彩色名片
 » PVC卡
 » 彩色磁性卡
 » 彩页/画册
 » 个性印务
 » 彩色不干胶
 » 明信片
   » 明信片
   » 彩色书签
   » 门挂
 » 其他产品与服务
   » 创业锦囊
   » 办公用品
     » 信封、信纸
     » 便签纸、斜面纸砖
     » 无碳复印纸
   » 海报
   » 大篇幅印刷
     » KT板
     » 海报
     » 横幅

ASP利用正表达式解析HTML的类代码

VBScript5中增加了许多新功能,最振奋人心的当属类和正则表达式的出现。以下是本人写的一个解析html代码的类。我是学php的,语法有不习惯的地方,请大家多包含。
<%
Class HTMLParse
’ 设置 Initialize 事件。
Private Sub Class_Initialize
myGlobal = True
myIgnoreCase = True
End Sub

Property Let Global(g)
Dim regEx ’ 建立变量。
Set regEx = New RegExp ’ 建立正则表达式。
regEx.Pattern = "True|False|1|0" ’ 设置模式。
regEx.IgnoreCase = True ’ 设置是否区分大小写。
If regEx.Test(CStr(g)) Then
myGlobal = g
Else
Call Halt("无效Global参数配置")
End If
End Property

Property Get Global()
Global = myGlobal
End Property

Property Let IgnoreCase(c)
Dim regEx
Set regEx = New RegExp
regEx.Pattern = "True|False|1|0"
regEx.IgnoreCase = True
If regEx.Test(CStr(c)) Then
myIgnoreCase = c
Else
Call Halt("无效IgnoreCase参数配置")
End If
End Property

Property Get IgnoreCase()
IgnoreCase = myIgnoreCase
End Property

’解析所有HTML标记的函数
Public Function Parse(input)
Parse = "<table border=1 width=50% align=center>" & vbCrLf
Dim regEx , regVal , match , i

Set regEx = New RegExp
regEx.Pattern = "<([a-z]w*)(?:.*?)>(.*)</1>"
regEx.Global = myGlobal
regEx.IgnoreCase = myIgnoreCase

Set regVal = regEx.Execute(Trim(input))
If regVal.Count > 0 Then ’假如发现匹配元素
Parse = Parse & "<caption>发现" & regVal.Count & "个HTML标记</caption>" & vbCrLf
Parse = Parse & "<tr align=center><th>编号</th><th>匹配标记<th>匹配显示< /th></tr>" & vbCrLf
For i=0 To regVal.Count-1
Set match = regVal(i)
Parse = Parse & "<tr align=center>" & vbCrLf
Parse = Parse & "<td>" & i+1 & "</td><td>" & match.SubMatches(0) & "</td><td>" & match
& "</td>" & vbCrLf
Parse = Parse & "</tr>" & vbCrLf
Next
Else Parse = Parse & "<caption>没有发现HTML标记</caption>" & vbCrLf
End If
Parse = Parse & "</table>" & vbCrLf
End Function

’解析指定HTML标记的函数
Public Function ParseTag(input,tag)
ParseTag = "<table border=1 width=50% align=center>" & vbCrLf
Dim regEx , regVal , match , i

Set regEx = New RegExp
regEx.Pattern = "<(" & tag & ")(?:.*?)>(.*?)</1>"
regEx.Global = myGlobal
regEx.IgnoreCase = myIgnoreCase

Set regVal = regEx.Execute(Trim(input))
If regVal.Count > 0 Then ’假如发现匹配元素
ParseTag = ParseTag & "<caption>发现" & regVal.Count & "个" & UCase(tag) & "标记</caption>" &
vbCrLf
ParseTag = ParseTag & "<tr align=center><th>编号</th><th>发现位置<th>包含内容< /th></tr>" &
vbCrLf
For i=0 To regVal.Count-1
Set match = regVal(i)
ParseTag = ParseTag & "<tr align=center>" & vbCrLf
ParseTag = ParseTag & "<td>" & i+1 & "</td><td>" & match.FirstIndex & "</td><td>" &
match.SubMatches(1) & "</td>" & vbCrLf
ParseTag = ParseTag & "</tr>" & vbCrLf
Next
Else ParseTag = ParseTag & "<caption>没有发现" & UCase(tag) & "标记</caption>" & vbCrLf
End If
ParseTag = ParseTag & "</table>" & vbCrLf
End Function

’打印错误
Private Sub Halt(errstr)
Response.Write("<font color=red size=3>" & errstr & "</font>" & vbCrLf)
Call Class_Terminate
End Sub

Private Sub Class_Terminate ’ 设置 Terminate 事件。
End Sub

’定义两个内部变量
Private myGlobal
Private myIgnoreCase

End Class
%>

<html>
<body>
<div align=center><h2>范例1</h2></div>
<%
’范例1
Dim input , result
input = "<i>这是</i>一个<font color=green>VBScript</font>的<b>正则<i>表达式</i>范例</b>。"

Set hp = New HTMLParse
hp.Global = 1
hp.IgnoreCase = False
result = hp.Parse(input)
Response.Write(result)
%>
<br>
<div align=center><h2>范例2</h2></div>
<%
’范例2
’hp.Global = 1
’hp.IgnoreCase = False
result2 = hp.ParseTag(input,"i")
Response.Write(result2)
Set hp = Nothing
%>
</body>
</html>
返回类别: 教程
上一教程: ASP发送邮件的CLASS
下一教程: 使用ISAPI过滤器增强IIS的功能

您可以阅读与"ASP利用正表达式解析HTML的类代码"相关的教程:
· 用正则表达式写的HTML分离函数
· 通过几个异常实用的例子了解ASP中使用正则表达式
· 使用正则表达式实现模式图片新闻.ASP
· 好东西,老外用正则表达式写的HTML分离函数
· 在ASP中利用“正则表达式” 对象实现UBB风格的论坛
    微笑服务 优质保证 索取样品