`

2013-3-10日志

 
阅读更多

《集体智慧编程》第二章总结:

 

首先是需要数据

 

第二是构建好数据集之后,使用数据来度量用户间的相似度,

 

相似度有以下度量:

参考:http://hi.baidu.com/black/item/79295353bb1bb8dfd58bac62

 

第三步,相似度求出后,可以将其视作从某用户出发对其它用户的打分,然后可以从该用户出发的对物品的打分,具体是以各用户的打分为加权系数,对所有相关用户(对物品打过分的用户),求和:用户对物品的打分*该用户的打分(加权系数),再除以加权系数之和,示得该物品对该用户的具体得分,越高越好。

 

以上过程的数据集,如果调整下顺序,不是用户:{物品:分数},而变成物品:{用户:分数}则可以变成物品与物品的相关

 

然后有一个del.icio.us的例子,此例中的打分仅有1和0两个选项。

 

最后是基于物品的协作型过滤,没有细讲,推测就是先前调整顺序的算法。

 

最后的最后,注意两种不同算法的作用场合的分析

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics