Grabage,Java开源采集工具
编程技术  /  houtizong 发布于 3年前   153
开源,源码,open source,java,htmlunit,采集
http://code.google.com/p/grabage/
近来研究网站建设的时候发现采集工具这么个东西,用来帮助站长抓取数据。
使广大站长摆脱繁琐的复制粘贴。看到一些国产CMS自带采集工具,颇为实用。
想起来造轮子单独写一个采集程序有几个原因:
鉴于此,决定用Java写一个开源的工具,方便同学们采集。
本程序可客户端运行,采集后的数据暂未处理,代码开源。
所以不用担心程序搜集登录信息,有编程经验者可自行修改。
源码供个人站长及劳苦大众研究使用,但禁止将其已任何形式用于商业活动。
详细使用权限请参阅《GNU General Public License v3》
再一次强调的是:采集有风险,小心被K站。
首先在http://code.google.com/p/grabage/downloads/list 中下载指定的源码版本,如grabage_0.1_nk_src.zip
需要使用的组件可在该路径下下载,有经验的开发人员可自行至其主站上下载最新版本。
下面是文件需要的组件列表:
1 - 16 of 16
下载后 用ide(如eclipse)引入源码,将源码中resource的路径指定到编译路径下。
编译运行ReadCenter,如控制台输出>>>LINK>>>http://portal.czol.info/news/money
则正常通过,如报异常,请检查工程路径配置。
请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!
技术博客集 - 网站简介:
前后端技术:
后端基于Hyperf2.1框架开发,前端使用Bootstrap可视化布局系统生成
网站主要作用:
1.编程技术分享及讨论交流,内置聊天系统;
2.测试交流框架问题,比如:Hyperf、Laravel、TP、beego;
3.本站数据是基于大数据采集等爬虫技术为基础助力分享知识,如有侵权请发邮件到站长邮箱,站长会尽快处理;
4.站长邮箱:[email protected];
文章归档
文章标签
友情链接