文章列表
从网上下了lucene2.9.0的包,开始着手研究;看到那些大牛们提到在控制台窗口中进行了研究,所以自己很想试试看:
1)解压缩lucene2.9.0的包后,会看到lucene-core-2.9.0.jar和lucene-demos-2.9.0.jar这两个包
2)将这两个jar包配置到系统环境变量classpath中
3)打开一个控制台终端,在其中运行相关命令即可。
比如说:java org.apache.lucene.demo.IndexFiles D:\srctest
我很郁闷的是开始的时候将环境变量的名字classpath搞错了写成clas ...
- 2009-10-18 21:26
- 浏览 947
- 评论(0)
Collections是个java.util下的类,它包含有各种有关集合操作的静态方法。
Collection是个java.util下的接口,它是各种集合结构的父接口。
List, Set, Map是否继承自Collection接口? List,Set是 Map不是
ArrayList和Vector的区别。
一.同步性:Vector是线程安全的,也就是说是同步的,而ArrayList是线程序不安全的,不是同步的
二.数据增长:当需要增长时,Vector默认增长为原来一培,而ArrayList却是原来的一半
HashMap和Hashtable的区别
一.历史原因:Hashtable是 ...
- 2009-07-11 17:37
- 浏览 1019
- 评论(0)
(一)搜素引擎工作原理的两个重要的很容易混淆的问题:
1)当用户提交查询的时候,搜索引擎并不是即刻在web上“搜索”一通,发现那些相关的网页,形成列表呈现给用户;而是事先已“搜集”了一批网页,以某种方式存放在系统中,此时的搜索只是在系统内部进行而已。
2)当用户感到返回结果列表中的某一项很可能是他需要的,从而点击URL,获得网页全文的时候,他此时访问的则是网页的原始出处。因此,从理论上讲搜索引擎并不保证用户在返回结果列表看的标题和摘要内容与他点击URL所看到的内容一致,甚至不保证那个网页的存在。这是搜素引擎和传统信息检索系统的一个重要区别。
(二)现代大规模高质量搜索引擎一般采用三个阶段:网页 ...
- 2009-07-08 20:32
- 浏览 701
- 评论(0)
一,ping
它是用来检查网络是否通畅或者网络连接速度的命令。作为一个生活在网络上的管理员或者黑客来说,ping命令是第一个必须掌握的DOS命令,它所利用的原理是这样的:网络上的机器都有唯一确定的IP地址,我们给目标IP地址发送一个数据包,对方就要返回一个同样大小的数据包,根据返回的数据包我们可以确定目标主机的存在,可以初步判断目标主机的操作系统等。下面就来看看它的一些常用的操作。先看看帮助吧,在DOS窗口中键入:ping /? 回车,。所示的帮助画面。在此,我们只掌握一些基本的很有用的参数就可以了(下同)。
-t 表示将不间断向目标IP发送数据包,直到我们强迫其停止。试 ...
- 2009-06-29 22:32
- 浏览 581
- 评论(0)
首先,确定你的行业,和最关注的企业,把自己的简历放到人家的官方网站上(如IBM的官方招聘网址为http:// www-07.ibm.com/ employment/cn/index.html),然后定期去心仪企业的网站察看最新职位,并申请!
其次,大多数的著名外企都会在以下最权威网站(如果时间有限就看这四个就够用了)发布自己的招聘职位和申请流程,
http://www.chinahr.com
http://www.51job.com
http://www.zhaopin.com
http://www.fesco.com.cn
实习和全职都有,希望大家每日/每周关注,一定会 ...
- 2009-06-27 21:50
- 浏览 1251
- 评论(0)
记得小时候,我很憧憬长大。因为我觉得等长大了,父母就再也管不着我了。可以想喝凉水就喝凉水,中午想不睡觉就不睡觉,那一定很幸福。
等我真的长大,父母也的确管不着了,可当初认为的幸福并没有到来。因为,虽然没 ...
- 2009-06-27 21:49
- 浏览 735
- 评论(0)
爬虫hertrix中的关键的几个类是:
1)CrawlOrder
2)CrawlController
3)Frontier链接制造工厂以及BdbFrontier的实现方式
4)多线程的实现(ToeThread和ToePool)
5)处理链和Processer
- 2009-06-27 11:10
- 浏览 873
- 评论(0)
最后,对于在这篇文章中提到的分析源代码程序的一些方法做一下小结,以作为本文的结束。
分析一个源代码,一个有效的方法是:
1、阅读源代码的说明文档,比如本例中的README, 作者写的非常的详细,仔细读过之后,在阅读 ...
- 2009-06-27 00:38
- 浏览 733
- 评论(0)
由于工作的关系,我常常需要读一些源代码,并在上面做一些修改并且拿来使用,或者是借鉴其中的某些部分。可以说,open source对于程序员来说,是很有意义的事情。根据我的经验,读源代码,至少有3个好处。第一 ...
- 2009-06-27 00:37
- 浏览 906
- 评论(0)
最近有做源码阅读的事情,觉得有些费尽,做了一些思考。
一个大项目的源代码,不要过份详细的阅读。大项目,其代码量基本上是可以吓死人的。过份的关注细节,常常会拘泥于细节,而忽略了整体框架。当你能够看清框架的 ...
- 2009-06-27 00:35
- 浏览 887
- 评论(0)
java和c++的相似之处多于不同之处,但两种语言问几处主要的不同使得Java更容易学习,并且编程环境更为简单。
我在这里不能完全列出不同之处,仅列出比较显著的区别:
1.指针
JAVA语言让编程者无法找到指针来直接访问内存 ...
- 2009-06-25 14:52
- 浏览 1143
- 评论(0)
c/c++:
1. static在c,c++中有什么不同点
2. 堆和栈的区别
3. 纯虚函数
4. 指针和引用的区别
5. 如果构造函数出错,如何处理?
6. 对设计模式是否熟悉,用过哪些?
7. c++如何使用c中的函数,为什么?
数据结构:
8. AVL,不懂,平衡二叉树,唉,咋叫这缩写呢
操作系统:
9. 进程和线程的区别
10. 进程间通信的方法,我答案中有socket,问两个进程,socket通信,一个进程将一个指针发送过去,另一个进程是否可用
linux
11. /proc下的文件是干什么用的? ...
- 2009-06-25 14:50
- 浏览 822
- 评论(0)
1、智能指针,com实现的原理,
2、printf()可变参数如何实现
3、标准模板库vector追加数据如何实现。是底层如何实现,不能用现有的东东。
4、还有,java的垃圾收集机制如何实现为什么?如果是你自己实现垃圾收集机制,如何实现? 用什么数据结构。
5、二叉排序树和哈希表那个查找效率高,实用于pda 。
6、.net的底层实现机制。
7、进程间通信如何实现。
8、还有迭代问题,什么问题用迭代,迭代在操作系统中如何实现的 。
9、如何交换两个变量,不能用中间变量。
10、c与c++ static函数的区别???
11、const 函数的作用,如何实现钩子函数。
12 ...
- 2009-06-25 14:49
- 浏览 1199
- 评论(0)
1.介绍一下STL,详细说明STL如何实现vector。
Answer:
STL (标准模版库,Standard Template Library.它由容器算法迭代器组成。
STL有以下的一些优点:
可以方便容易地实现搜索数据或对数据排序等一系列的算法;
调试程序时更加安全和方便 ...
- 2009-06-25 14:47
- 浏览 963
- 评论(0)
爬虫的几个关键技术点
- 博客分类:
- 网络爬虫
最近在研究爬虫的实现,看了几个代码,感觉在爬虫的设计中有几点很重要:
1)网页的获取
2)网页中URL的提取
3)URL的合法性校验
4)URL是否已经存在
5)网页的深度的判断
6)爬去策略?深度优先和广度优先
- 2009-06-25 11:20
- 浏览 1405
- 评论(0)