`
iovy
  • 浏览: 5644 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论
文章列表
最近公司需要个过滤黑名单的程序,到javaeye上看了下,大家搞的太难了,看不大懂,就写了个简单的。 一个树,每个节点有个hashmap,一个iskeyword,通过isKeyWord来判断是否关键字,如果不是通过hashmap向下找寻,如果hashmap找不到,从root节点重新找 import java.util.*; public class Trie {         private Vertex root;         public static void main(String[] args){     Trie t = new Trie();     t.add ...
最近准备写个爬虫程序,今天看了下,貌似有个WebHarvest是开源的,下载了看看,稍微看了下他的代码,感觉他对配置文件的处理挺好的。 在正常情况下,处理配置文件,我们可以用dom4j或者jdom啥的来解决,但是因为WebHarvest中的配置文件会有N种不同的类型,如果按照以前的那种解析方式,就会产生N多的判断条件。 在WebHarvest中,他通过jdk自带的javax.xml.parsers.SAXParser来解析,   SAXParser parser = parserFactory.newSAXParser();   parser.parse(in, handler); 这里的han ...
抓取tianya页面的程序
希望查询某个酒店的某个房型的某一天价格. 酒店有多种房型,每个房型有不同的价格.而在某一天或者某段时间类,房价有特殊的价格(例如.情人节,双人间价格为500.周末 所有房价+20%,黄金周,除经济房外,其他都加10%) 本人初步设想: 表1:酒店 房型 基础价格 特价关系KEY 表2:特价关系KEY 特价起始时间 特价结束时间 特价 优先度 但是用JAVA实现起来,相当烦琐,请解决. 以上描述有可能不很清楚,麻烦跟贴说明,非常感谢.
Global site tag (gtag.js) - Google Analytics