找回密码
 加入
搜索
楼主: love5173

[网络通信] 读取IE源码的问题

 火.. [复制链接]
发表于 2011-4-13 20:57:13 | 显示全部楼层
只是编码问题
$Html = BinaryToString(InetRead("http://www.wowxunyou.com/"),4)
MsgBox(0,"源码",$Html)
 楼主| 发表于 2011-4-13 21:39:10 | 显示全部楼层
回复 16# 风行者
虽然也不能得到我需要的,但是学习你这样的表达方式
 楼主| 发表于 2011-4-13 21:48:16 | 显示全部楼层
回复 15# afan
太强了 万分感谢
发表于 2011-4-13 22:07:32 | 显示全部楼层
afan 发表于 2011-4-13 20:57



    A大果然是A大!!佩服佩服
  A大的这个例子很值得玩味啊!
  其实前面几位已经给出取数据的代码了,但是得到的结果与A大不同,问题就出在那段商品展示的方式上,初始化是它用了一段js代码夹带xmlhttp去服务器取了一段数据,而直接浏览主页代码,或者读取http数据是看不到这些的,所以几位的方法达不到楼主的要求。
   但是,嗯哼,但是我发现A大套用_IEDocReadHTML后,情况发生了变化,原本隐藏的数据,尽然完全暴露了!直接填写到html里了,不用post了,_IEDocReadHTML完全代劳了。
   实在值得仔细比较下这其中过程与IE.au3的细节
发表于 2011-4-13 22:21:40 | 显示全部楼层
找到了,帮助啊,万能的帮助
#include <IE.au3> 
_IEDocReadHTML ( ByRef $o_object )

注意/说明
本函数返回的源代码是经过客户端改动之后的网页的源码(如通过AutoIt或者客户端JavaScript). 因此可能和在浏览器中显示的或通过_INetGetSource得到的源码不一样.
发表于 2011-4-13 22:37:16 | 显示全部楼层
回复 19# bakefish


    过奖了~ 你研究得很透彻啊~ 呵呵
我知道LZ的乱码只是小问题,关键是获取不到完整的网页源码~
我曾经也对Js郁闷过,经过一番测试最后使用_IEDocReadHTML()成功~ 之后基本上如果采用其它方法不能完整获取的我都会用此方法。
 楼主| 发表于 2011-4-13 23:45:34 | 显示全部楼层
回复 21# afan
乱码是小问题,什么问题呢
发表于 2011-4-13 23:53:14 | 显示全部楼层
回复 22# love5173


    我想一般是网页中指定的编码格式与文件格式不符造成的。你1#的方式修改下即可
#include <INet.au3>
$s_URL='http://www.wowxunyou.com/'
$soure = _INetGetSource($s_URL, 0)
Msgbox(0, 0, BinaryToString($soure, 4))
发表于 2011-4-19 15:11:29 | 显示全部楼层
请问,能否读取IE源码,并识别其中的表单,输出到Excel中使用?
发表于 2011-4-19 20:31:50 | 显示全部楼层
请问,怎么从IE源码中,提取表单部份的html代码保存出来?
提取<form …………………… </form>这部份代码出来
发表于 2011-4-20 22:04:33 | 显示全部楼层
我觉得都是写入文本里面然后提取比较方便
发表于 2013-5-27 23:57:39 | 显示全部楼层
这个好  支持你一下
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-5-17 06:01 , Processed in 0.069328 second(s), 14 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表