找回密码
 加入
搜索
楼主: 卫和谐

[网络通信] [已解决]这个网页中的内容用正则怎么提取

 火... [复制链接]
 楼主| 发表于 2011-11-25 21:09:57 | 显示全部楼层
回复 44# 3mile


    我是想要28楼代码那种形式,来提取个人的!
发表于 2011-11-25 21:17:56 | 显示全部楼层
回复 46# 卫和谐
什么意思?二维数组不合意?
#include <INet.au3>
#include <array.au3>

$str=_INetGetSource ( "http://mms.shm.com.cn/smsRegs/2011jc/ListInfo.aspx",False)
$str=BinaryToString($str,4)
;<!--单位人气-->
$array=StringRegExp($str,'(?ms)\<\!--个人人气--\>.*?/table\>',3)
$str=_ArrayToString($array,@CRLF)
$array=StringRegExp($str,'>\h*([\x{4e00}-\x{9fa5}\d]+)<',3)
Local $out_array[UBound($array)/3][2]
Local $out1[UBound($array)/3]
Local $out2[UBound($array)/3]
Local $k=0

For $i=0 to UBound($array)-1 Step 3
        $out_array[$k][0]=$array[$i+1]
        $out_array[$k][1]=$array[$i+2]
        
        $out1[$k]=$array[$i+1]
        $out2[$k]=$array[$i+2]
        $k+=1
Next
_ArrayDisplay($out_array)
_ArrayDisplay($out1)
_ArrayDisplay($out2)

评分

参与人数 1金钱 +10 贡献 +2 收起 理由
lixiaolong + 10 + 2 今天学到了很多!

查看全部评分

发表于 2011-11-25 21:19:47 | 显示全部楼层
回复 43# 卫和谐


    不明白你为何要分开取,它们都是成对出现的。
id=[^>]+?>\h*(\S{2,4})</a></t
(?s)id=[^>]+?>\h*\S{2,4}</a></t.+?>\h*(\d+票)

评分

参与人数 1金钱 +10 贡献 +2 收起 理由
lixiaolong + 10 + 2 看懂了,呵呵

查看全部评分

发表于 2011-11-25 21:34:18 | 显示全部楼层
回复 34# afan

没注意那个了...要考虑很多...向您学习!
发表于 2011-11-25 21:41:37 | 显示全部楼层
回复 49# lixiaolong


    的确需要考虑很多,呵呵~ 也向你学习~
 楼主| 发表于 2011-11-25 21:47:03 | 显示全部楼层
感谢AFAN,有时间好好学习一下正则!
发表于 2011-11-26 10:11:15 | 显示全部楼层
回复 51# 卫和谐
哇,卫兄人气很高啊,这么多高人帮你啊!哈哈,看来你是公务员啊!
发表于 2011-11-28 22:59:41 | 显示全部楼层

"哥玩的不是正则,是折腾"
开个玩笑哈^ ^
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-5-16 17:20 , Processed in 0.083881 second(s), 19 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表