`
lzj0470
  • 浏览: 1273152 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论
文章列表
一、入门 《Java 2从入门到精通》- 推荐 《Thinking in Java》- 强烈推荐* O’reilly的Java编程基础系列 - 参考* 二、进阶 《Java Cook Book》- 非常推荐* (包含了Java编程的Tips,适合当做手册来查阅) 《O’reilly-Java IO》- 推荐* (包含Java IO编程的各个方面) 《O’reilly-Database Programming with JDBC》- 推荐* (JDBC编程) 《O’reilly-Java Programming with Oracle JDBC》- 参考* 三、Java We ...
如果有人问你,你的电脑怎么开机?回答不外乎是:“直接按电脑机箱上的电源开关按钮不就得了”。这当然是最简单的方法。不过,其实打开电脑还有许多方法,下面笔者就给大家介绍四种神奇的电脑开机方法。   方法一: ...
ARP(Address Resolution Protocol)既地址解释协议,主要的目的是用于进行IP和MAC地址解释的。IP是网络层协议,而MAC是被数据链路层使用。网络中两个节点要进行通信,那么首先发送端必须要知道源和目的地的MAC地址,而网络层是使用IP地址,所以要获得MAC地址,就必须通过IP地址获取对应的MAC地址,这样就需要使用ARP协议将IP地址转换为MAC地址,而同时为了能够快速的找到目的地的MAC地址,每个节点都会有一个ARP缓存,用于保存已经转好好的MAC地址,大家可以在控制台下使用arp –a指令查看arp缓存表。       而ARP具体过程就是当需要通过IP获取一个 ...
刚安装了wxDev C++,新建一个空的对话框工程,没做任何增改直接编译,提示2个错误: 1、undefined reference to `__cpu_features_init'' 2、ld   returned   1   exit   status 解决办法: 新添加环境变量:        LIBRARY_PATH:  C:\Dev-Cpp\lib;C:\Dev-Cpp\mingw32\lib       C_INCLUDE_PATH:C:\Dev-Cpp\include

信息检索导论

    * 原书名:  Introduction to Information Retriveal     * 原出版社: Cambridge University Press     * 作者: (美)Christopher D. Manning    (美)Prabhakar Raghavan    (德)Hinrich Schutze    [作译者介绍]     * 译者: 王斌     * 丛书名: 图灵计算机科学丛书     * 出版社:人民邮电出版社     * ISBN:9787115234247     * 上架时间:2010-9-1     * 出版日期:2010 年9月 ...
由MD5生成的32位这样的字符串有N多。现在想问一下,怎么才能用不重复或者极少量重复的整型来表示。 有人建议用bloomfilter算法。但是,hash不好设计。 哪位有更好的hash设计或者想法,可以说说。
最近做httpclient做转发服务,发现服务器上总是有很多close_wait状态的连接,而且这些连接都不会关闭,最后导致服务器没法建立新的网络连接,从而停止响应。 后来在网上搜索了一下,发现解决的方法也很简单,如果想重用连接,那就使用连接管理器,从连接管理器里获取连接,然后定时的用连接管理器来释放空闲连接。httpclient自带了SimpleHttpConnectionManager,提供了Java代码 closeIdleConnections(long idleTimeout) closeIdleConnections(long idleTimeout) 这样的方法。 如果不需要重用链 ...
查看了两天,一直不明白为什么句柄数那么高,今天搞到重装系统,所有的软件和程序都安装好。 没运行什么东西,句柄数还是在12W左右。没办法,就一个一个进程关闭,看看哪个占用句柄数高。发现是mysql一启动就占用了几万。我吓~,忙找原因,在网络上找到解决办法. 修改my.ini文件中 innodb_buffer_pool_size设为1M之后,消耗句柄急剧减。 据说,该参数会影响到MySQL的InnoDB表的效率 谨慎设置
在一个爬虫程序中遇到了以下异常: java.net.SocketException No buffer space available (maximum connections reached?): JVM_Bind 我们知道,操作系统有它允许持有的最大文件句柄数,而在网络连接的过程中,每个socket请求都要占用一个文件句柄资源,如果没有及时释放,则可能会耗尽文件句柄资源. 通过检查代码,发现在使用HttpClient发送Get请求时没有释放资源,并且由于是多线程程序,很容易耗尽资源 改写后的代码如下: HttpClient client = new HttpClient(); ...
任何一段信息文字,都可以对应一个不太长的随机数,作为区别它和其它信息的指纹(Fingerprint)。只要算法设计的好,任何两段信息的指纹都很难重复,就如同人类的指纹一样。信息指纹在加密、信息压缩和处理中有着广泛的应用。 我们在图论和网络爬虫一文中提到,为了防止重复下载同一个网页,我们需要在哈希表中纪录已经访问过的网址(URL)。但是在哈希表中以字符串的形式直接存储网址,既费内存空间,又浪费查找时间。现在的网址一般都较长,比如,如果在 Google 或者百度在查找数学之美,对应的网址长度在一百个字符以上。下面是百度的链接 http://www.baidu.com/s?ie=gb2312&am ...
布隆过滤器是由巴顿.布隆于一九七零年提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。我们通过上面的例子来说明起工作原理。 假定我们存储一亿个电子邮件地址,我们先建立一个十六亿二进制(比特), ...
Column 1. Cracking the oyster 问题:     输入:7位电话号码的数据文件,纪录数量是百万级的;     输出:排序后的数据文件;     限制:内存只有2M,尽量快速; 分析: 后面有七位数字,它们的范围是[0, 9999999],,纪录个数是千万级,而1M内存能存储25000个整数。 该问题的本质是数学上的Dense-Set,可以用Bit Map(或者叫Bit Vector)解决,方法如下:     1)根据数据范围,建立一个BIT MAP,电话的范围是 1000000~9999999 ,那么建立含一千万个bit的数据结构bit _bit[10000000],初 ...
大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到。 下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的 ...
http://ajava.org/opens/gis/index.html
开发你自己的XMPP IM 续 - Spark 插件开发 继续3月18日介绍基于XMPP IM开发的那篇Blog,今天主要总结一下如何基于Spark 的插件架构来新增客户端的功能,这里列举出一个获取服务器端群组信息的实际例子,实现后的效果如下图所示: ...
Global site tag (gtag.js) - Google Analytics