找回密码
 加入
搜索
查看: 2594|回复: 3

[IE类操作] 读取网页二行内容,保存在文件中ini或txt中,要读取200多个这样的网页,请高手帮忙

[复制链接]
发表于 2012-8-14 14:26:35 | 显示全部楼层 |阅读模式
本帖最后由 coolybin 于 2012-8-14 14:46 编辑

读取网页二行内容,保存在文件中ini或txt中,要读取200多个这样的网页,请高手帮忙啊

网页是会计财政网的

http://202.109.244.108:8001/website/applicationds/cy_ksinfo/print_newzkz.jsp?txtdlname=!!!!!!!!!&ifds=2

这个网址下去直接显示个人信息(!!!!!!!!!这里是200多个身证号码,每一个号码中要读取二行文字   这二行是前面是固定的,一个是考证号,和考试时间。)

将这二行保存在一文本文件或ini文件都行。找了一上午实在找不出来,所以求助大家。先谢谢大家了。
<body>
<form id="frm" name="frm" method="post" action="">
<div align=center class=noprint id=explain><font color=red><input type=button name=button_print value="打印" onclick="cyprint();"> 请使用A4纸打印!<input type=button name=button_close value="关闭" onclick="javascript:window.close()"></font></div>
<br>
<table width="620" align=center border=0 class=tab1 >
<tr><td>
<table width="600" align=center border=0 >
      <tr>
        <td align="left" height="20" colspan="3" >
                <span style="font-size: 10.5pt; font-family: 宋体; color: black">
                报名序号:000220120712052721</span></td>
      </tr>
      <tr>
        <td align="center" height="30" colspan="3" ><b>
                <font face="宋体" style="font-size:25px;color:#000000;font-weight:800;">准  考  证</font></b></td>
      </tr>
      <tr>
        <td align="center" height="25" colspan="3" >
                <span style="font-size:14px; font-family: 宋体; color: black">
                厦门市会计从业资格无纸化考试</span></td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">姓    名:</td>
                <td align="left" height="25" width="369" class="td1">田燕燕</td>
                <td align="left" rowspan=6 width="127">
                <img src="/images/attachment/ks/2012/07/12/350481198402293511.JPG"  width="90" height="110"></td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">准考证号:</td>
        <td align="left" height="25" width="369" class="td1">120030201555772</td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">证件号码:</td>
        <td align="left" height="25" width="369" class="td1">350481198402000528</td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">考点名称:</td>
        <td align="left" height="25" width="369" class="td1">厦门市中华会计函授学校</td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">考点地址:</td>
        <td align="left" height="25" width="369" class="td1">厦门市故宫路98号
                </td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">场次时间:</td>
        <td align="left" height="25" width="369" class="td1">2012-09-20 14:30:00.0至2012-09-20 17:30:00.0
                </td>
      </tr>
</table>
准考证号:
场次时间:
读取这二个保存,纠结,还在奋斗中
 楼主| 发表于 2012-8-14 14:41:00 | 显示全部楼层
<body>
<form id="frm" name="frm" method="post" action="">
<div align=center class=noprint id=explain><font color=red><input type=button name=button_print value="打印" onclick="cyprint();"> 请使用A4纸打印!<input type=button name=button_close value="关闭" onclick="javascript:window.close()"></font></div>
<br>
<table width="620" align=center border=0 class=tab1 >
<tr><td>
<table width="600" align=center border=0 >
      <tr>
        <td align="left" height="20" colspan="3" >
                <span style="font-size: 10.5pt; font-family: 宋体; color: black">
                报名序号:000220120712052721</span></td>
      </tr>
      <tr>
        <td align="center" height="30" colspan="3" ><b>
                <font face="宋体" style="font-size:25px;color:#000000;font-weight:800;">准  考  证</font></b></td>
      </tr>
      <tr>
        <td align="center" height="25" colspan="3" >
                <span style="font-size:14px; font-family: 宋体; color: black">
                厦门市会计从业资格无纸化考试</span></td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">姓    名:</td>
                <td align="left" height="25" width="369" class="td1">姓名</td>
                <td align="left" rowspan=6 width="127">
                <img src="/images/attachment/ks/2012/07/12/350481198402293.JPG"  width="90" height="110"></td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">准考证号:</td>
        <td align="left" height="25" width="369" class="td1">准考证号在这里</td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">证件号码:</td>
        <td align="left" height="25" width="369" class="td1">证件号码在这里</td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">考点名称:</td>
        <td align="left" height="25" width="369" class="td1">厦门市中华会计函授学校</td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">考点地址:</td>
        <td align="left" height="25" width="369" class="td1">厦门市故宫路98号
                </td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">场次时间:</td>
        <td align="left" height="25" width="369" class="td1">2012-09-20 14:30:00.0至2012-09-20 17:30:00.0
                </td>
      </tr>
</table>

准考证号:
场次时间:
保存下来就好。
纠结,奋斗中。。
 楼主| 发表于 2012-8-14 14:46:01 | 显示全部楼层
<body>
<form id="frm" name="frm" method="post" action="">
<div align=center class=noprint id=explain><font color=red><input type=button name=button_print value="打印" onclick="cyprint();"> 请使用A4纸打印!<input type=button name=button_close value="关闭" onclick="javascript:window.close()"></font></div>
<br>
<table width="620" align=center border=0 class=tab1 >
<tr><td>
<table width="600" align=center border=0 >
      <tr>
        <td align="left" height="20" colspan="3" >
                <span style="font-size: 10.5pt; font-family: 宋体; color: black">
                报名序号:000220120712052721</span></td>
      </tr>
      <tr>
        <td align="center" height="30" colspan="3" ><b>
                <font face="宋体" style="font-size:25px;color:#000000;font-weight:800;">准  考  证</font></b></td>
      </tr>
      <tr>
        <td align="center" height="25" colspan="3" >
                <span style="font-size:14px; font-family: 宋体; color: black">
                厦门市会计从业资格无纸化考试</span></td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">姓    名:</td>
                <td align="left" height="25" width="369" class="td1">田燕燕</td>
                <td align="left" rowspan=6 width="127">
                <img src="/images/attachment/ks/2012/07/12/350481198402293511.JPG"  width="90" height="110"></td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">准考证号:</td>
        <td align="left" height="25" width="369" class="td1">120030201555772</td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">证件号码:</td>
        <td align="left" height="25" width="369" class="td1">350481198402000528</td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">考点名称:</td>
        <td align="left" height="25" width="369" class="td1">厦门市中华会计函授学校</td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">考点地址:</td>
        <td align="left" height="25" width="369" class="td1">厦门市故宫路98号
                </td>
      </tr>
      <tr>
        <td align="left" height="25" width="91" class="td1">场次时间:</td>
        <td align="left" height="25" width="369" class="td1">2012-09-20 14:30:00.0至2012-09-20 17:30:00.0
                </td>
      </tr>
</table>
准考证号:
场次时间:
读取这二个保存,纠结,还在奋斗中
发表于 2012-8-16 11:59:19 | 显示全部楼层
$bookTextm = StringRegExp($str, '(?s)证件号码:</td> <td align="left" height="25" width="369" class="td1">(.+?)<br /></div>', 3) ;取证件号码
发表于 2012-8-17 12:08:18 | 显示全部楼层
好像可以实现。以前看过。采集数据嘛
发表于 2012-8-17 12:15:57 | 显示全部楼层
用正则来实现
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-5-17 00:01 , Processed in 0.080919 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表