kk网页信息批量采集导出工具是一个批量采集多个页面的信息并让任意网页拥有导出功能工具,软件轻巧简约,汇集批量访问网址,POST提交访问、页面信息采集,3个简单功能,即可实现强大的复杂繁琐的批量信息采集与网页操作。
软件说明
顾名思义,它能够采集网页上的任何信息,并帮你导出到电脑,同时,你也可以同时加入多个页面,让它批量化帮你采集你需要的信息。
采集到的信息,支持导出为文本txt与表格.xlsx格式。这样,他不仅给任意网页插上翅膀,让网页支持导出特定信息,它更能批量导出多个页面的这些信息。
网页信息批量提取工具,因为自己工作需要,管理后台订单和商品列表不支持导出,汇总时,一个个的复制粘贴到excel,难免很复杂,本来1分钟能完成的事,要手动半小时重复去做这些机械化的动作。于是为了解决这些问题,第1个版本于2017年发布出来。让有同样需要的同学,也能够更高效率的处理问题。
它支持截取网页一部分信息,导出来,同时也支持从截取的信息片断的列表中,匹配出多条循环的信息。
更可以:
1、以post方式请求抓取数据
2、自定义网页head协议头,伪装任何浏览器进行访问
3、同时可设定抓取间隔,避免采集迅速被别人网站服务器屏蔽ip
4、将采集到的结果,导出为excel或txt
它不仅拥有采集信息的功能,如果你拥有自己的网站,还能将这样信息或者电脑excel里的信息,帮你发布到你的网站了。
你可以用它来做什么:
1、采集网页里的多条信息(标题/网址/时间等),导出
2、批量采集多个网页中的信息,导出
3、批量去访问打开页面,比如有些站长需批量向百度提交收录,挨个打开太费事
高效工作
批量自动访问多个网页(支持get/post)
请求网页时,同时可根据设置从页面中截取出需要的信息
截取出的信息列表可一键导出
软件特色
支持模拟浏览器/登陆cookie等协议头访问
支持设置抓取频率,防止被服务器频率
支持多种格式(.txt/.xls/剪切板)导出到电脑
使用场景
账号挂机:模拟登陆后,周期性的自动刷新/批量请求访问多个网页
采集导出:将已加的QQ群的QQ号,批量导出来
批量删除:利用批量post功能,自动删除自己的微博、QQ空间说说等信息
批量更新:电话回访客户记录到excel,将回访信息批量更新到对应用户的crm
订单导出:公司后台没导出功能,自动采集订单详细的信息,导出到电脑
导出收藏:逛论坛收藏了很多帖子,将帖子导出到电脑,方便搜索整理
用户采集:提取并导出网站上用户的id/注册时间等信息
批量更新:在论坛上发了很多帖子,批量删除或将帖子批量设置成255权限
使用说明
那么,如何使用它,来采集一个网站的信息,并发布到自己的网站上
只需要几步:
1、写文章页抓取文章标题和内容的规则,并记下来。
2、使用“小工具”中的序列网址生成工具,生成一系列的列表网址。如:list/1.html,list/2.html,list/3.html,...,list/999.html,从别人网站的列表页能看到有多少页,有多少页就生成多个条列表网址。
3、写取匹配列表页所有文章的规则:即从列表页面,取出所有文章链接,匹配出来,再导出来
4、再将步骤3导出的文章网址,作为采集目标,输出到网址框中。再填上步骤1的规则,即可自动将这些页面的文章标题和链接等信息采集出来。
到这里,目前网站某栏目的所有文章的标题,链接,都已经采集到,并导出为excel,那么如何将这个excel发布到自己的网站?
5、在excel中将单元格手动合成post提交的信息格式。如:title=kkno1&content=com
6、提交网址填写文章发布后台的post接收网址,并在软件中完善协议头的cookie信息(模拟网站管理员登陆后台),然后在post参数中,填入步骤5生成的post提交格式,再点批量处理,软件即可自动批量post方式,将这样信息,逐个提交到post接收页,达到自动发布的功能。
从采集到发布的完整过程。看起来步骤多,实际上,只做了3次匹配。