`
san_yun
  • 浏览: 2637902 次
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

rank排名算法整理

 
阅读更多

1.Delicious.com 热门书签排行榜

按照"过去60分钟内被收藏的次数"进行排名
优点:简单
缺点:排名变化不够平滑,缺乏自动淘汰旧项目的机制

2. Hacker News

根据得票数,系统自动统计出热门文章排行榜,并非得票最多的文章排在第一位,还要考虑时间因素,新文章应该比旧文章更容易得到好的排名。算法实现:http://pastebin.com/ZF57qQPi,
上面的代码还原为数学公式:

Score = (P-1) / (T+2)^G

其中:

  1. P表示帖子的得票数,减去1是为了忽略发帖人的投票。
  2. T表示距离发帖的时间(单位为小时),加上2是为了防止最新的帖子导致分母过小(之所以选择2,可能是因为从原始文章出现在其他网站,到转贴至Hacker News,平均需要两个小时)。
  3. G表示"重力因子"(gravityth power),即将帖子排名往下拉的力量,默认值为1.8



 
此图中可以发现:
有三个同时发表的帖子,得票分别为200票、60票和30票(减1后为199、59和29),分别以黄色、紫色和蓝色表示。在任一个时间点上,都是黄色曲线在最上方,蓝色曲线在最下方。

此图中可以发现:
三根曲线的其他参数都一样,G的值分别为1.5、1.8和2.0。G值越大,曲线越陡峭,排名下降得越快,意味着排行榜的更新速度越快。

下面是python的实现

def calculate_score(votes, item_hour_age, gravity=1.8):
    return (votes - 1) / pow((item_hour_age+2), gravity)
  • 大小: 11.7 KB
分享到:
评论

相关推荐

    TextRank算法程序说明1

    该算法受到了PageRank算法的启发,由Google创始人拉里·佩奇提出,用于网页排名。在TextRank中,每个单词或短语被视为图中的节点,而节点之间的边则表示它们在文本中的共现关系或相似性。 在Python中,`jieba`模块...

    页面排名:页面排名算法-matlab开发

    页面排名是搜索引擎优化中的核心概念,它通过特定的算法来确定网页在搜索结果中的排序位置。...下载并解压"page_rank.zip"文件,你将能够看到具体的MATLAB代码实现,进一步学习和研究页面排名算法。

    会议/期刊分级与排名整理(国内与国际)

    此外,还有SCImago Journal Rank (SJR) 和Eigenfactor,它们采用不同的算法来评估期刊的影响力。 计算机科学领域的顶级会议,如ACM SIGGRAPH、SIGMOD、SIGIR、SIGKDD、NIPS(现NeurIPS)、ICML、CVPR、 ICCV和ICIP...

    DataCompetitionTopSolution-数据竞赛top解决方案开源整理.docx

    - 主要贡献:整理并分享了各类数据竞赛的排名靠前的解决方案,包括代码、模型和策略。 - 目标用户:对数据竞赛感兴趣,希望学习顶级参赛者方法的开发者和研究者。 2. 涉及的数据竞赛及Top解决方案: - 科大讯飞...

    acm模板(我自己整理的)

    - **应用场景**:常用于算法竞赛题目,特别是涉及到求解特定排列的排名或生成特定排名的排列。 #### 计算原理 - 对于任意一个排列`P = (p1, p2, ..., pn)`,其中`pi`为排列中的第`i`个元素,康托展开的计算公式如下...

    通过异构学术网络对科学文章进行排名

    4. 新型排名算法HOMR的提出:本文提出了一种基于张量表示的相互排名算法HOMR,通过实验证明了其在排名学术出版物方面的有效性。 5. 学术评价的多元维度:文章强调排名不仅仅是对文章的评价,还包括对作者和出版机构...

    ACM南桥竞赛学习资料包

    参赛队伍需在限定时间内编写代码,提交给评判系统,系统会自动进行运行和测试,根据正确解答的问题数量和时间来排名。 二、竞赛内容与技巧 1. 数据结构:ACM竞赛中,熟悉并灵活运用各种数据结构(如链表、树、图、...

    matlab人头检测的代码-awesome-matlab-rank-1000:awesome-matlab-rank-1000

    matlab人头检测的代码matlab星星1000以内排名整理 ID 名称 描述 星星 1个 纸张“ Deep Photo Style Transfer”的代码和数据: 9.2千 2个 PRML书籍中用于机器学习算法的Matlab代码 4.1千 3 OpenFace –用于面部界标...

    GitHub 干货各大数据竞赛 Top 解决方案开源汇总

    参赛队伍需设计算法并分析数据,结果根据特定评估指标在线评测排名。 - **未提供具体排名方案链接**:尽管没有提供具体的排名方案链接,但此类竞赛通常会涉及大量的数据预处理、特征工程以及模型选择与优化等环节。...

    FastBlogFinder

    用户可以根据博客的PR值(Page Rank)、Alexa排名、更新频率等因素进行过滤,确保找到的博客具有较高的质量和活跃度。同时,软件还能导出搜索结果,方便进一步的分析和整理。 此外,FastBlogFinder还具备一些额外的...

    搜索引擎优化(SEO)知识完全手册

    - **超链分析技术的应用**:广泛应用于现代搜索引擎的排名算法中。 - **存在的缺陷**:容易受到链接农场等作弊手段的影响。 **4.3 中文分词** - **什么是中文分词**:将连续的汉字序列切分成具有语义单位的词语的...

    处理各大OJ比赛数据收集与统计统计事宜.zip

    在编程和算法竞赛的世界里,"OJ"通常指的是在线判题系统(Online Judge),如LeetCode、HackerRank和Codeforces等。这些平台提供了一系列的编程题目供参赛者解决,以此来提升编程技巧和算法能力。处理OJ比赛数据的...

    SEO优化推广工具大全

    9. **监控与报告**:Rank Tracker、SEMrush或Moz Pro提供排名监控和报告功能,帮助追踪优化进度,调整策略。 10. **本地SEO**:对于实体店来说,本地SEO尤为重要。Google My Business可以帮助管理和优化商家的在线...

    网站运营推广策略.docx

    7. **SEO专业术语**:包括关键词密度、PR(Page Rank)、SERP(Search Engine Result Page)、元标签、爬虫、算法等。 8. **SEO优势**:长期有效的流量来源、提升品牌信誉、提高用户满意度、降低广告成本。 9. **...

    spark考试练习题含答案.rar

    3. **Spark SQL的窗口函数**:如row_number(), rank(), dense_rank()等,用于处理分组内的排序和分组间的排名问题。 四、Spark Streaming 1. **DStream(Discretized Stream)**:Spark Streaming中的基本抽象,...

    外链接增加工具资源库(骨头,下雨天,choba等等)的链接库升级版

    - **无重复**:该资源库经过精心整理,确保每一条链接都是独一无二的,避免了因重复链接而导致的效果降低。 - **手工升级**:所有链接均由个人手工升级完成,确保链接的有效性和高质量性。 - **兼容性强**:支持多种...

    Excel表格公式大全.doc

    7. **排名**:`=RANK(K2,K$2:K$56)` RANK函数返回K2单元格在K2到K56区域内的排名。 8. **等级划分**:`=IF(K2>=85,"优",IF(K2>=74,"良",IF(K2>=60,"及格","不及格")))` 使用嵌套的IF函数根据分数划分等级。 9. **...

    期末大作业报告1

    在模型训练过程中,通常会使用HR(Hit Rate)和MRR(Mean Reciprocal Rank)作为评估指标,HR衡量的是预测结果中命中用户真实行为的比例,MRR则关注预测结果的排名。 实验结果评价阶段,HR和MRR是衡量推荐系统性能...

    awards

    6. **专业排名**:在技术平台如LeetCode、HackerRank等的全球排名,可以展示编程技能和解决问题的能力。 “awards-main”可能是这个压缩包的主文件,里面可能包含上述各种成就的详细信息,如证书图片、竞赛结果、...

Global site tag (gtag.js) - Google Analytics