`
leiyonglin
  • 浏览: 52712 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
社区版块
存档分类
最新评论

使用欧几里德距离构建简单的推荐系统计算用户相似度

阅读更多

在计算用户相似度的过程中,首先对于两个用户共同打分过的所有条目,计算他们对于每个条目的评分差值,对差值求平方、求和,再对结果求平方根,这样得到的值称为欧氏距离,但这并不足以作为显示度计算的度量值。相似度与距离的概念在某种程度上说是互反的,就其意义而言,欧氏距离越小,两个用户相似度就越大。相似度与距离这种反序关系很容易就可以调整过来,比如只要第一显示度为欧氏距离加1,再取倒数。

 

02data.php

 


getSimilarity.php

 

 

 

上面的代码先求出两个用户有一些共同评分的歌曲,那么把他们对其中每首歌曲评分差值的平方和除以这部分歌曲的数量,再对商取平方根,最后用1减去这个双切正切函数的返回值,最后还考虑的两个用户共有的条目的量与两个人所有可能共有条目量的比率。

 

 

分享到:
评论

相关推荐

    自己动手搭建一个电影推荐系统

    自己动手搭建电影推荐系统 作为一名 IT 行业大师,我将为您详细解释该自建电影推荐系统的知识点...该自建电影推荐系统的知识点涵盖了推荐系统的概念、分类、相似度计算算法、实现要点和动手构建电影推荐系统的步骤。

    python简单推荐系统(含完整代码).pdf

    在本文中,我们将探讨如何使用Python实现一个简单的电影推荐系统,该系统旨在根据用户对电影的评分来推荐类似的电影。 【收集信息】 构建推荐系统的第一步是收集必要的数据。对于电影推荐系统,我们需要的是用户对...

    数字图像处理实验7matlib彩色图像处理

    例如,对于图像分割,我们可以计算每个像素与一个特定区域的平均颜色的欧几里德距离,然后根据这个距离来决定像素是否属于该区域。MATLAB中的`pdist2`函数可用于计算两组像素间的欧几里德距离。 **三、马氏距离** ...

    模式识别距离分类器PPT课件.pptx

    常见的距离函数包括欧几里德距离(平方和的平方根),曼哈顿距离(各维度差的绝对值之和),明氏距离(p次方和的开方,p可调),以及角度相似函数(两个向量的内积除以它们各自的范数,也就是余弦相似度)。...

    k-最近邻搜索库_C++

    它所做的唯一假设是,可以使用用户提供的函数在任何一对对象上计算相似度得分。 根据最近的基准,KGraph 是最快的 k-NN 搜索库之一。 为获得最佳通用性,应使用 C++ API。模块名称 pykgraph 下提供了一个 python ...

    高分辨率光学遥感场景分类的深度度量学习方法.pdf

    接着,使用欧几里德距离方法计算平均中心度量损失。最后,使用交叉熵损失函数和权重项来构建最终的损失函数。该方法的目标是通过迫使 intra-class 紧凑度和 inter-class 可分离性来提高分类准确性。 在实验结果中,...

    数据挖掘中的聚类分析研究

    常见的距离包括欧几里德距离、曼哈顿距离、明考斯基距离、切比雪夫距离以及马哈劳林比斯距离等。其中,欧几里德距离是最常用的,其定义为: \[ d_{ij} = \sqrt{\sum_{k=1}^{p}(X_{ki} - X_{kj})^2} \] 其中,\( ...

    聚类算法综述

    1. **欧几里德距离**:是两向量在欧几里得空间中直线距离的平方,是最直观的距离度量,但在处理具有不同尺度或单位的特征时可能不理想。 2. **余弦距离**:衡量两个向量在多维空间中的角度差异,而非它们之间的直线...

    数据仓库和数据挖掘技术复习汇报材料.doc

    15. 当邻近度函数采用平方欧几里德距离时,K均值算法的质心是簇内点的平均值,而不是中位数。 16. 数据粒度描述了数据的详细程度,粒度更细意味着更详细的数据,但粒度更大表示数据更综合,粒度的划分影响查询质量...

Global site tag (gtag.js) - Google Analytics