现在市面上充斥着一些收费的网页采集器,这样一款绿色免费的网页采集器不管他功能怎么样,是免费的就很难得了!
本软件通过互联网,采集网页信息。有两大特色功能:
1,可以采集js之后的动态信息。
2,可以设定采集的正则表达式。
另外,本软件内置多种采集方案,分别对应静态网页和动态网页。
官网的图片(人脸)搜索引擎的数据都是用这个软件采集,然后才做索引的。
使用步骤:
1,输入网址,正常浏览网页到达采集目标后,点击工具栏上的“查看js后源码”图标,则显示执行js后的网页内容。
如果没有看到相关内容,可以等待片刻再次点击,以保证js代码执行完毕。通过浏览完整的网页源码,我们可以确定
使用方案1还是方案2。如果更改网址的页码就可以导航到下一页,则使用方案1;如果是通过脚本动态更新网页内容,
则使用方案2。
2,点击工具栏上的“运行采集方案”图标,根据步骤1,选择方案1或2。如果已经有方案1和2生成的downloadtotal.txt
文件,也可以选择方案3。填入必要的信息或者表达式,点击“开始采集”按钮,系统将自动采集。点击对话框的“取消”
按钮,则不启动采集任务直接关闭对话框。
3,点击工具栏上的“停止采集方案”图标,系统终止采集任务。
防止网页采集:
防止采集第一种方法:在文章的头尾加上随机不固定的内容。网站采集者在采集时,通常都是指定一个开始位置和一个结束位置,截取中间的内容。
比如你的文章内容是"有讯软件信息网",则随机内容的加入方法:
注:随机内容1和随机内容2每篇文章只要随机显示一个就可以了.






















大小: 1.1M

刷PV工具(刷网站点击量)v1.0.0.1绿色版
流量宝V2.3.1423 绿色免费版
流量神器v2.0.1.0 免费版
windows2003 64位 iis安装包完整版
xamppsv8.1.2 最新版【x64】
apache tomcat8.5.20 官方版【x86x64】
网站抓取精灵3.1.0.0 正式版
飞达鲁长尾词查询工具V2.9.13.263 中文绿色版
本地PHP服务器MiniServer(迷你WAMP)v1.2 绿色版
网页截图扩展(Webpage Screenshot)5.4.9.9 chrome
Simon爱站关键词采集工具4.0 无限制免费版
google 工具条全新版6.4.1321.1732
Apache Tomcatv10.0.10 官方版
域名批量查询(Domain Name Analyzer Pro)v4.5 英文绿色特别版