找回密码
 加入
搜索
查看: 3107|回复: 5

[IE类操作] 求个含中文的正则表达式

  [复制链接]
发表于 2010-6-4 17:48:26 | 显示全部楼层 |阅读模式
网页代码如下:
<td height="35" align="center">64541562</td>
          <td height="35" align="center">张三</td>         
          <td colspan="3" align="left">&nbsp;</td>
</td>         
就是中间的那个“张三”,不知道如何用正则表达式取出来。
有谁能帮个忙吗?
发表于 2010-6-4 19:20:15 | 显示全部楼层
本帖最后由 afan 于 2010-6-4 19:27 编辑

按位置捕获:
$Str = _
                '<td height="35" align="center">64541562</td>' & @CRLF & _
                '          <td height="35" align="center">张三</td>          ' & @CRLF & _
                '          <td colspan="3" align="left"> </td>' & @CRLF & _
                '</td>'
$sR = StringRegExp($str, 'center">(.+)</td>\s+<td colspan\=', 3)
If Not @Error Then Msgbox(0, $sR[0], $str)
或者捕获含中文的:
$Str = _
                '<td height="35" align="center">64541562</td>' & @CRLF & _
                '          <td height="35" align="center">张三</td>          ' & @CRLF & _
                '          <td colspan="3" align="left"> </td>' & @CRLF & _
                '</td>'
$sR = StringRegExp($str, 'center">(.*[^\x00-\xff].*)</td>', 3)
If Not @Error Then Msgbox(0, $sR[0], $str)

评分

参与人数 1金钱 +20 收起 理由
kn007 + 20

查看全部评分

发表于 2010-6-4 19:51:47 | 显示全部楼层
第2个是我想要的e#24
 楼主| 发表于 2010-6-5 10:02:06 | 显示全部楼层
本帖最后由 chenbo2003 于 2010-6-6 10:43 编辑

谢谢2楼的回答,第2个好象捕获的不止中文,是捕获含中文。
再多说一句,我要捕获信息的那个网页,用“查看源文件”的方法得到的是一楼的代码,而通过_IEBodyReadHTML 获取的则是另外一种代码,所以开始用2楼的方法时也没有成功,这个我也是后来才发现的,不知道这对大家有没有帮助。
发表于 2010-6-5 13:29:01 | 显示全部楼层
回复 4# chenbo2003


    你不是要求的“含中文”吗?
获取源码的方式不同造成的获取的源码不同是肯定的,当然正则也会不同。你用什么方式获取自然也要用相应的正则来匹配~
发表于 2010-6-5 13:41:52 | 显示全部楼层
谢谢2楼的回答,第2个好象捕获的不止中文,是捕获含中文。
再多说一句,我要捕获信息的那个网页,用“查看 ...
chenbo2003 发表于 2010-6-5 10:02


那你不是应该把_IEBodyReadHTML 获取的源代码粘贴上来吗?
正则是强大
但不足以能强大到成为使用者肚子里的一条虫
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-5-18 18:18 , Processed in 0.077630 second(s), 25 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表