`
Tristan_S
  • 浏览: 378621 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

机器学习

 
阅读更多
机器学习中比较实用的是推荐引擎和分类算法
分类算法-k近邻  能有效的提高图片识别的成功率。
还有可以作为垃圾邮件的过滤器。

----------------
推荐引擎
基于用户 GenericUserBasedRecommender
相似度+ 邻域
相似度 UserSimilarity
   实现的算法有
    PearsonCorrelationSimilarity  -- 皮尔逊
    EuclideanDistanceSimilarity -- 欧式距离
    TanimotoCoefficientSimilarity  -- 谷本系数
邻域  UserNeighborhood
   实现的算法
   NearestNUserNeighbordhood  -- 近邻
   ThresholdUserNeighborhood -- 基于阀值

基于物品  GenericItemBasedRecommender
只要考虑相似度 接口为 ItemSimilarity
实现算法和基于用户的一样

基于模型
Slope-One
Slopeone算法不同于前面提到的基于相似度的算法,他计算简单快速,对新用户推荐效果不错,数据更新和扩展性都很不错,预测能达到和基于相似度的算法差不多的效果,很适合在实际项目中使用。

基本原理:
用户对itema打分对itemb打分
X34
Y24
Z4?

用户Z对itemb的打分可能是多少呢? Slope one算法认为:所有用户对事物A对itemb的打分平均差值是:((3 - 4) + (2 - 4)) / 2 = -1.5,也就是说人们对itemb的打分一般比事物A的打分要高1.5,于是Slope one算法就猜测Z对itemb的打分是4 + 1.5 = 5.5


分布式
物品之间的共现矩阵 和基于物品的ItemSimilarity (也是放到一个矩阵中)很相似。
只是这个矩阵太大无法放在一台机器上, 按行来切分
类似于 物品X/物品i:次数i, 物品j:次数j, 物品k:次数k
最后乘以该用户的评分向量, 得到最后的结果。

实现相当复杂 可以直接在hadoop平台中调用RecommenderJob 来运行。




----------------------

mahout--使用
pyhton--原理

回归 -- 计算预测值
场景 销售量预测

线性回归  Y=4*X1+18*X2   4和18 是回归系数
非线性回归(多项式)  Y=4*X1/18*X2 

回归的目标是找到最佳拟合线
过拟合现象 - 考虑了太多的噪声

关联分析 -- Apriopri
有点像推荐算法中的物物共现矩阵

P(尿布)=4/5   P(尿布,葡萄酒)=3/5
P(葡萄酒|尿布)=P(尿布,葡萄酒)/P(尿布)=3/4

当物品成千上万时,想找到支持度大于0.8的物物关系,遍历的做法会非常的慢。

Apriopri原理
如果一个项集是非频繁的, 那么它所有的子项集也是非频繁的。


FP-growth  频繁项集
场景 搜索引擎自动补全查询词项, 找出经常在一起出现的词对 (共现词)

支持向量机
二类分类器, 当用其解决多类问题时, 则需要额外的方法对其扩展。
支持向量,就是离分割超平面最近的那些点。
SMO计算最大化支持向量



分享到:
评论

相关推荐

    机器学习/深度学习500问

    机器学习/深度学习500问机器学习/深度学习500问机器学习/深度学习500问机器学习/深度学习500问机器学习/深度学习500问机器学习/深度学习500问机器学习/深度学习500问机器学习/深度学习500问机器学习/深度学习500问...

    动手学机器学习.zip

    机器学习(ML)是计算机系统为了有效地执行特定任务,不使用明确的指令,而依赖模式和推理使用的算法和统计模型的科学研究。它被视为人工智能的一个子集。机器学习算法构建一个基于样本数据的数学模型,称为“训练...

    贝叶斯统计机器学习ppt

    本资源摘要信息将对贝叶斯统计机器学习的主要内容进行概括,从贝叶斯决策理论到机器学习问题实例,涵盖了机器学习的主要模型、模式识别与机器学习的基本问题等多个方面。 贝叶斯决策理论是机器学习中一个重要的理论...

    机器学习部分课后习题答案(较完整)

    机器学习部分课后习题答案(较完整)机器学习部分课后习题答案(较完整)机器学习部分课后习题答案(较完整)机器学习部分课后习题答案(较完整)机器学习部分课后习题答案(较完整)机器学习部分课后习题答案(较...

    机器学习算法与应用.pdf

    本文将从三个方面介绍机器学习算法:典型机器学习算法、量子机器学习、李群机器学习。 典型机器学习算法是机器学习的基础部分,包括监督学习、非监督学习、半监督学习等。监督学习是通过大量已标记的训练序列建立一...

    python机器学习教程-从零开始掌握Python机器学习:十四步教程.pdf

    【Python机器学习基础】 Python作为机器学习的首选语言,因其简洁的语法和强大的库支持而备受推崇。在开始机器学习之旅之前,首先需要掌握Python的基础编程技能。这包括理解变量、数据类型、控制结构(如if-else,...

    机器学习——回顾与展望.pdf

    "机器学习——回顾与展望.pdf" 机器学习是一门多学科交叉的学科,涉及到计算机科学、数学、统计学、神经科学、心理学等多个领域。它的研究对象是使计算机具备学习能力,使其能够像人类一样学习、认知和应用知识。 ...

    双重机器学习DML(代码+案例+数据)

    python-双重机器学习(Double Machine Learning, DML)是一种结合了机器学习和因果推断的统计方法,它在经济管理领域有着广泛的应用。这种方法特别适用于处理高维数据和复杂的非线性关系,同时能够提供无偏的参数...

    机器学习课程课件

    机器学习是计算机科学的一个分支,它致力于通过让计算机系统学习数据中的模式来改善其性能,而无需显式编程。这门课程的课件是大牛根据8年的实战经验精心总结的,涵盖了理论与实践的结合,旨在帮助学习者深入理解和...

    机器学习期末复习题.pdf

    机器学习期末复习题库 机器学习是人工智能领域中的一门重要学科,涉及到各种算法和技术,以下是机器学习期末复习题库的详细解析: 监督学习和无监督学习 监督学习是指在有标签的数据集上训练模型,以便在未来的...

    机器学习实战源代码.rar_python机器学习_机器学习_机器学习代码_机器学习实战_机器学习源码

    机器学习源码,供机器学习初学者下载,主要用的语言是python.

    吴恩达机器学习课后作业源码及笔记_机器学习_吴恩达_

    吴恩达是世界知名的计算机科学家和人工智能专家,他在机器学习领域的贡献极其显著,他的在线课程深受全球学习者喜爱。这份名为“吴恩达机器学习课后作业源码及笔记”的压缩包文件,无疑是针对他开设的机器学习课程的...

    李宏毅机器学习全套资料

    《李宏毅机器学习全套资料》是一份全面深入的机器学习教育资源,主要涵盖了教学演示文稿、作业解决方案以及详尽的课程内容。这份资源对于想要深入理解和掌握机器学习这一领域的学习者来说,无疑是一份宝贵的参考资料...

    西瓜书机器学习的学习笔记(十分详细)

    学习了机器学习的基础以及相关理论,颇有收获,并做了相关笔记,对于机器学习有了更为深入的理解,为以后的学习以及研究打下基础。 主要内容包含以下相关主题: - 模型的评估与选择 - 神经网络 - 支持向量机 - ...

    机器学习班PPT原件(全)(邹博)

    《机器学习班PPT原件(全)(邹博)》是一份全面的机器学习课程资料,由知名专家邹博提供,旨在为初学者提供扎实的机器学习基础。这份资料包含了从入门到进阶的各种机器学习算法,对于想要系统学习机器学习的人员来...

    机器学习方法及其技术应用.pdf

    机器学习方法及其技术应用 机器学习是一种人工智能应用的重要研究领域,它研究如何使机器通过识别和利用现有知识获取新知识和新技能。机器学习系统的基本结构模型可以描述为图1所示的形式。 机器学习系统的核心是...

    机器学习30讲.pdf

    机器学习公式推导与代码实现 很多同学在学习机器学习的时候,理论粗略看一遍之后就直接上手编程了,非常值得表扬。但是他不是真正的上 手写算法,而是去直接调用 sklearn 这样的 package,这就不大妥当了。笔者不是...

    机器学习期末复习试卷.doc

    机器学习期末复习试卷 机器学习是人工智能的核心技术之一,涉及到计算机科学、数学、统计学、神经网络等领域。机器学习的主要目标是使机器能够自主学习、自主决策和自主改进,而不需要人为干预。下面是机器学习期末...

    机器学习系统面临的安全攻击及其防御技术研究.pdf

    机器学习系统面临的安全攻击及其防御技术研究 机器学习系统在近年来得到了广泛应用,但是随着机器学习系统的广泛应用,安全问题也日益严重。研究表明,机器学习系统可能遭遇到各种攻击,包括数据污染攻击、对学习...

    机器学习matlab源代码.rar

    机器学习matlab源代码机器学习matlab源代码机器学习matlab源代码机器学习matlab源代码机器学习matlab源代码机器学习matlab源代码机器学习matlab源代码机器学习matlab源代码机器学习matlab源代码机器学习matlab源代码...

Global site tag (gtag.js) - Google Analytics