`
neolimeng
  • 浏览: 83674 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
文章列表
原文网址:http://hi.baidu.com/syimiaoa/blog/item/999e29f7934cdd26720eec84.html heritrix默认使用8080端口,要保证系统端口没有冲突。之后便可以访问 http://127.0.0.1:8080 或http://localhost:8080 使用 heritrix 
1.你需要精通面向对象分析与设计(OOA/OOD)、涉及模式(GOF,J2EEDP)以及综合模式。你应该十分了解UML,尤其是class,object,interaction以及statediagrams。   2.你需要学习JAVA语言的基础知识以及它的核心类库(collections,serialization,streams,networking,   multithreading,reflection,event,handling,NIO,localization,以及其他)。   3.你应该了解JVM,classloaders,classreflect,以及垃圾回收的基本工作机制等。你 ...
关于搜索引擎书籍中国目前比较少,有过这方面了解的朋友一般都看过2007年人民邮电出版 lucene 2.0+heritrix 这本书吧。本人感觉还不错,理论知识较少点,具体步骤还比较详细。适合初学者。       简单介绍下heritrix: heritrix 是Java编写的开源爬虫。 扩展性比较好,但是配置适合的采集规则,比较复杂难理解。适合学习和研究。       此书中的heritrix在eclipse中的配置写的不够详细,我把自己成功的配置贡献给大家。 <1>首先要去官网下载最新版本的heritrix。下载地址为: http://sourceforge.ne ...
问题的解决方法主要有两种: 1、将<many-to-one>  & <set> 中设置 lazy="false"。 2、OpenSessionInView解决办法。 后者不需要更改映射文件的配置即可解决这个问题,Neo觉得比较好。具体做法如下: (第一步) 在web.xml中加入如下内容: <!-- 实现在Spring管理Hibernate时的延迟加载。如果去掉会导致延迟加载出现问题。 --> <!-- org.springframework.orm.hibernate3.support.OpenSessionInV ...
Global site tag (gtag.js) - Google Analytics