`
xautlx
  • 浏览: 12951 次
  • 来自: ...
文章分类
社区版块
存档分类
最新评论
文章列表
S2JH:基于SSH的企业Web应用开发框架    https://github.com/xautlx/s2jh http://git.oschina.net/xautlx/s2jh   项目详细WIKI文档: https://github.com/xautlx/s2jh/wiki/Index     Introduction 集结最新主流时尚开源技术的面向企业级Web应用的基础开发框架,提供一个J2EE相关主流开源技术架构整合及一些企业应用基础通用功能和
内容摘自 http://git.oschina.net/xautlx/nutch-ajax 抓取数据持久化处理设计 MySQL解析数据存储 为了适应不同项目对不同感兴趣属性的解析存储,数据存储结构采用纵向的属性列表方式,即一个url页面多个属性存储多条记录方式,并且按照text,html,data,num几大典型类型分别对应存储。 创建UTF-8字符集的nutch数据库,并执行表初始化脚本,参考DDL: CREATE TABLE `crawl_data` ( `url` varchar(255) NOT NULL, `code` varchar(255) NOT ...
趁着小长假整理一下代码和文档,虽然还有需要完善的地方,但是本着 "Done is better than Perfect" 的原则,还是先放出S2JH全新2.0系初始版本发布,重大变更如下: 彻底改头换面的UI交互界面,先瞄一眼:https://github.com/xautlx/s2jh/wiki/UI 全面扩展增强的Grid表格组件:https://github.com/xautlx/s2jh/wiki/Grid 更好的浏览器兼容性和移动设备访问及集成支持:https://github.com/xautlx/s2jh/wiki/Mobile ...
Java Swing C/S版本12306订票助手 https://github.com/xautlx/12306-hunter http://git.oschina.net/xautlx/hunter-12306 本程序完全开放源代码,仅作为技术学习研究交流之用,不得用于任何商业用途;作者不承担任何由此带来的直接或间接责任 ...
作为 S2JH: 基于SSH的企业Web应用开发框架 提供相关技术点介绍系列,一方面算是给出自己对某一个特定问题的设计实现思路分享供有兴趣朋友参考,另一方面也算是与大家一起探讨汲取各位同行更多更好的设计。更多框架相关技术文档可直接访问: https://github.com/xautlx/s2jh/wiki/Index -------------------------------------------正文部分-------------------------------------------- 概要说明 借助Hibernate Envers组件,实现对数据变更进行自动的审计记录 ...
基于过滤链设计模式、Htmlunit扩展、异步多线程等特性的简化定向数据爬取解析组件,提供基于天猫商品的数据采集演示单元测试(s2jh\crawl-service\src\test\java\lab\s2jh\crawl\service\test\CrawlServiceTest.java)   说明:此套爬虫设计主要用于一些定向网站数据抓取解析,如电商商品、交友信息等,抓取和解析特定页面的属性数据。如果是全网爬取之类的页面采集需求建议使用更专业的爬虫工具,如Apache Nutch.   工程代码: https://github.com/xautlx/s2jh/tree/maste ...
Global site tag (gtag.js) - Google Analytics