找回密码
 加入
搜索
查看: 2031|回复: 2

[IE类操作] 网页内容抓取 求一正则

[复制链接]
发表于 2012-8-14 17:25:30 | 显示全部楼层 |阅读模式
http://video.shishicai.cn/haoma/cqssc/list/120.aspx
网页地址

求抓取前4期后3位号码。
帮下谢谢StringRegExp 我学不入门啊,太菜了写不出来啊。。
发表于 2012-8-20 16:26:00 | 显示全部楼层
正则到底是个什么意思?一直没弄明白,好学吗?
发表于 2012-8-22 10:21:48 | 显示全部楼层
本帖最后由 syhsieh 于 2012-8-22 10:22 编辑

我的作法:
1. 將網址內容存成檔案
2. 你要擷取的資料都在 591 行。所以,從這個點往上尋找 div id=????
3. id=????  搜尋一下 id name 在其他行是否有重複?
4. 沒有。可知 bonusNumberDataContainer 就是它的 id name
5. 搜尋檔案內容 <div id="bonusNumberDataContainer"></div> 字串所在位置往下 +2行就是你要的字串
6. 分離 你要的字串
搞定
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-5-17 00:11 , Processed in 0.073047 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表