最新文章列表

怎样通过词频得到这个词频的排序?

     在大规模检索中,我们怎样通过已经的词频得到词频的排序? 通俗点讲,就是当我知道“java”这个词的频率是x,那么"java"到底在排在第几位呢?       大规模数据中,有一个重要的法则叫“齐普夫法则”,它描述为第k个出现次数最多的词汇,它的词频与1/k成正比。这个法则的发现过程一点都不科学,齐普夫是这样干的:找到一本大部头的书籍,统计不同词汇出现的次数并排序,发觉词 ...
AngelAndAngel 评论(0) 有2109人浏览 2012-12-03 14:35

大规模服务中的问题小记

大规模web服务要点: 1)可靠性、负载均衡问题 由于web服务的访问量巨大,一台服务器无法承担负载,而近十几年来的趋势表明,“横向扩展”(scale o ...
johnawm 评论(0) 有1013人浏览 2012-08-20 12:43

最近博客热门TAG

Java(141741) C(73643) C++(68602) SQL(64557) C#(59604) XML(59131) HTML(59042) JavaScript(54916) .net(54782) Web(54511) 工作(54116) Linux(50906) Oracle(49861) 应用服务器(43285) Spring(40811) 编程(39452) Windows(39380) JSP(37540) MySQL(37266) 数据结构(36420)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics