- 浏览: 200505 次
- 性别:
- 来自: 北京
最新评论
-
shijingjing07:
好文!必须得顶
解析JavaScript中的null和undefined -
bryan.liu:
非常清晰易懂的解释了浦东Web Service 和RESTfu ...
解析Restful Web Service -
yyang1986321:
lucene的hit类 -
lshmouse:
今年百度之星复赛的第一题就是这个问题,不过限定内存1M
大数据量的查询词缓存 -
wangichao:
看过了 不错!但不是自己想要的哦!
现在的也在搞数据库的架构 ...
大数据量的查询词缓存
文章列表
问题描述:
有一串数字(可正可负的int,放在数组Num里),要求找到起始位置start和终止位置end,使得从start位置到end位置的所有数字之和最大,返回这个最大值max。最简单的方法是用动态规划算法实现:设 f[x] 为以 a[x] 终止且 ...
- 2009-07-08 20:54
- 浏览 3726
- 评论(0)
citeseer数据集的下载地址:
http://www.cs.umd.edu/~sen/lbc-proj/data/citeseer.tgz
看了这么长时间的论文,马上就要开题了,把之前看过的论文中有用的东西总结总结。
鉴于临近毕业,实验室比较吵杂,严重影响工作,还是先从实验数据集整理吧,hoho~
- 2009-06-23 10:25
- 浏览 3551
- 评论(0)
转自:http://blog.sina.com.cn/s/blog_4c98b96001000boc.html --苯苯的小田园
真是找的很辛苦,唉!记下来吧.感谢论文Object Identication with
Attribute-Mediated Dependences提供了cora dataset 的来源:
http://www.cs.umass.edu/~mccallum/data/(如果复制打不开,请自己手动敲到地址栏中)
论文A Pitfall and Solution in Multi-Class Feature Selection for Text Classific ...
- 2009-06-23 09:55
- 浏览 4708
- 评论(0)
近日,jwill同学推荐两本书,记于此。
《C程序设计语言》
《数据结构与算法分析--C语言版》
作者主页:http://users.cs.fiu.edu/~weiss/
有很多学习资料哦~
此外,还有一本不错的关于C的书:《c语言程序设计现代方法》
习题答案:http://knking.com/books/c2/answers/index.html
- 2009-06-13 09:57
- 浏览 1330
- 评论(0)
箱排序和基数排序均属于分配排序。
分配排序的基本思想:排序过程无须比较关键字,而是通过"分配"和"收集"过程来实现排序.它们的时间复杂度可达到线性阶:O(n)。
一、箱排序(Bin Sort)
1、箱排序的基本思想
...
- 2009-06-08 21:16
- 浏览 1439
- 评论(0)
css设置一列td宽度
我的方法:
在css代码中设置td的width:5%(太大的话看不出效果)
下面是从网上看到的两个解决方法:
解决办法一:
1.插入表格。30行两列,宽380px
2.鼠标点在第一个单元格中(一行一列),在属性面板中输入宽度100
3.完成
解决办法二:
CSS代码
td.p10 {width:10%;}
td.p15 {width:15%;}
td.p20 {width:20%;}
td.p45 {width:45%;}
XML/HTML代码
<td class="p10">...</td& ...
- 2009-06-02 18:43
- 浏览 3988
- 评论(0)
TD元素noWrap属性的行为与TD元素的width属性有关。
◆如果未设置TD宽度,则noWrap属性是起作用的。
◆如果设置了TD宽度,则noWrap属性是不起作用的。
- 2009-06-02 16:19
- 浏览 1834
- 评论(0)
转载自: http://www.cnblogs.com/dotLive/archive/2007/04/04/699302.html
visibility隐藏的对象还保留对象显示时所占的物理空间,display则不保留。可以保存下面的代码看看效果:
具体步骤:
代码示例:
<div style="border:1px solid #000;background:#eee">
<span style="width:200;height:200;visibility:hidden"></span>
←SS属性为visib ...
- 2009-06-02 15:06
- 浏览 2307
- 评论(0)
转载自:http://bbs.blueidea.com/thread-2727499-1-3.html
前言
如果你想尝试一下不用表格来排版网页,而是用CSS来排版你的网页,也就是常听的用DIV来编排你的网页结构,又或者说你想学习网页标准设计,再或者说你的上司要你 ...
- 2009-06-02 14:57
- 浏览 799
- 评论(0)
本文转自:
http://daihaixiang.blog.163.com/blog/static/3830134200862394745683/
关于Hits类。
这个Hits类可是非常的重要,因为Lucene使用了缓存机制,关于缓存的实现就是在这个Hits类中。Hits工作过程中,使用了LRU算法,即通过一个HitDoc结构来实现一个双向链表,使用LRU置换算法,记录用户最近访问过的Document。
开门见山,直接拿出Hits类的实现代码来说话。
package org.apache.lucene.search;
import java.io.IOException;
import ...
- 2009-05-23 10:37
- 浏览 2725
- 评论(1)
Hash函数:任意长度的消息压缩成某一固定长度消息的函数。即Hash就是找到一种数据内 容和数据存放地址之间的映射关系。
任何class如果覆写了equals()方法,就必须覆写hashCode()。
1。在程序执行期间,同一个对象调用hashCode()必 ...
- 2009-05-22 20:21
- 浏览 1364
- 评论(0)
问题描述:
对简易搜索引擎的查询关键字建立缓存,将所有查询词都保存下来,并记录词频,当超过存储容量时,会根据词频替换掉词频小的查询词。数据量大,要用到磁盘存储。
初步思路:
对查询词进行分类,对每个类别的查询词进行排序,得到top-k个放入内存缓存。
分类:用hash,不过要自己重写hashcode函数
是否要用到归并排序?
索引?
如何存储?
原文:http://www.blogjava.net/javacap/archive/2007/12/13/167364.html
http://www.blogjava.net/javacap/archive/2007/12/14/167618.html
为了便于管理,先引入个基础类:
package algorithms;
/**
* @author yovn
*
*/
public abstract class Sorter<E extends Comparable<E>> {
public abstract void sort(E[] ...
- 2009-05-19 11:34
- 浏览 719
- 评论(0)
原文地址: http://www.ibm.com/developerworks/cn/xml/wa-ajaxintro2/
在 Web 请求中使用 XMLHttpRequest
级别: 中级
Brett McLaughlin (brett@newInstance.com), 作家,编辑, O'Reilly Media Inc.
2006 年 2 月 16 日
多数 Web 应用程序都使用请求/响应模型从服务器上获 ...
- 2009-05-17 21:22
- 浏览 696
- 评论(0)
原文地址 http://www.ad0.cn/netfetch/read.php/1134.htm
海量数据库的应用,如国家的人口管理系统,户籍档案管理系统,在这样的海量数据库应用中,数据库的存储设计和结构优化(如索引优化)、数据库的查询优化及分页算法尤为重要!
随着互联网的日益普及,海量信息的增长,网格运算的到来,海量数据存储产品和海量数据存储技术方案的需求更为市场所需。
同时,实际的海量数据处理,更是涉及很多细节,包括海量数据存储(物理存储、逻辑存储、海量数据库的备份)、数据采集、海量数据查询(海量数据分页、海量数据排序)、海量数据安全和管理等。
百度、goog ...
- 2009-05-17 21:19
- 浏览 2439
- 评论(0)