大数据-基于Spark的机器学习-智能客户系统项目实战
网盘地址:https://pan.baidu.com/s/19-U_XwIUZUENNgmz6VysMQ 密码: j288
备用地址(腾讯微云):https://share.weiyun.com/90d4d9196a9d86c74aabe8df78cdc624 密码:uq2q3w
项目背景:
1、现在很多平台客户关系管理系统都是使用传统的CRM,所有的信息全靠手工录入,用户寻找上下游企业或者信息只能靠手工去查找并且标注。
2、大数据时代的到来,人工智能,云计算,先进的分析,用机器去替代人工的部分,从 2016 年趋势看,机器学习和人工智能 (AI) 将在未来几年内将会彻底改变 CRM。
因此我们对CRM进行了改造,主要有如下部分:
1、企业信息、商品信息来自互联网,机器学习去自动统计分析并且分类。
2、用户录入的商品信息和新从互联网爬来的商品信息全部通过机器学习计算的模型去分类。
3、机器学习自动计算企业和供求信息上下游。
4、机器学习每隔一段时间自动去优化计算模型。
整个项目基本思路是如何通过爬虫爬取大量数据放到Hbase,然后通过ETL工具初步转化筛选将数据存到mongodb,抽取mongodb的数据进行清洗处理算出模型放到hdfs。后续进来数据通过模型运算出数据的类型。项目系统主要包括前端+后端+机器学习,前端采用React Native,Native,后端采用Dubbo+Spring+java,机器学习采用Spark进行实现,本项目机器学习-spark代码运行在mesos上。
分享到:
相关推荐
根据图识,项目将分为三个部分。...项目系统主要包括前端+后端+机器学习,前端采用React Native,Native,后端采用Dubbo+Spring+java,机器学习采用Spark进行实现,本项目机器学习-spark代码运行在mesos上。
《Hadoop Spark大数据巨量分析与机器学习整合开发实战》一书由林大贵编著,主要讲解了如何将大数据分析技术和机器学习技术结合起来进行实战开发。本书的重点是Hadoop和Spark这两个在大数据处理领域占据重要地位的...
标题:Spark机器学习案例实战 1. Spark简介 Apache Spark是一个开源的大数据处理框架,主要用于大规模数据集的处理。它构建在Hadoop之上,提供了比Hadoop MapReduce更快的数据处理能力。Spark提供了用于快速计算的...
电商+大数据+Spark机器学习(源码+项目说明).zip”是一个集成了电商、大数据和Spark机器学习的完整项目资源包。该项目旨在通过Spark强大的分布式计算能力和机器学习算法,深入分析电商数据,挖掘用户行为模式,优化...
《Python+Spark2.0+Hadoop机器学习与大数据实战》是一本深入探讨大数据处理和机器学习技术的书籍。在本书的练习部分,作者通过实际案例帮助读者掌握Python、Spark 2.0以及Hadoop的核心概念和技术。这些技术是当前大...
《大数据Spark企业级实战版》是一本专注于Spark技术在企业实际应用中的深度解析与实践指导的书籍。Spark作为当前大数据处理领域的重要工具,以其高效、易用和灵活的特点,广泛应用于数据处理、机器学习和流处理等多...
这是一个基于Hadoop和Spark的大数据金融信贷风险控制系统的设计与实现项目,主要应用于处理海量的金融信贷数据,通过分析和挖掘这些数据,以实现对信贷风险的有效控制。该项目的源码包含在"code"文件夹中,我们可以...
《Python+Spark 2.0+Hadoop机器学习与大数据》是一本深入探讨大数据处理与机器学习技术结合的著作。作者林大贵以其丰富的经验,详细介绍了如何利用Python、Spark 2.0以及Hadoop这一组合来构建高效的数据分析解决方案...
在大数据项目实战中,"招聘网站大数据职位分析"是一个典型的案例,它涵盖了多个重要的IT知识点。这个项目旨在通过收集、处理、分析招聘网站上的职位信息,挖掘出行业趋势、热门技能以及人才需求等有价值的数据。 1....
该项目名为“基于Java实现Spark2x新闻网大数据实时分析可视化系统”,是一个综合性的大数据处理与可视化解决方案,主要利用Java和Spark2x技术栈进行构建。在实际的企业环境中,此类项目对于实时处理海量新闻数据,...
该项目是针对大数据期末课设,以Spark为工具进行气象数据的处理与分析。在现代生活中,天气预报对于各行各业以及人们的日常生活都有着重要的影响。随着大数据技术的发展,气象数据分析变得更加精确和实时,有助于...
总之,《大数据Spark企业级实战》这本书旨在帮助读者掌握Spark的核心技术和应用场景,提升在大数据处理项目中的实战能力,对于想深入了解和运用Spark的IT从业者来说,是一份宝贵的参考资料。通过阅读和实践,你可以...
本实践教程将深入探讨如何使用Python编程语言进行金融大数据风控模型的构建,特别是基于机器学习的方法。我们将从以下几个关键知识点展开讨论: 1. **数据预处理**: - 数据清洗:处理缺失值、异常值和重复值,...
《Spark 2.x + Python 大数据机器学习实战》是一门深入探讨如何利用Apache Spark 2.x和Python进行大数据分析和机器学习的课程。Spark作为分布式计算框架,因其高效的内存计算和灵活的数据处理能力,成为了大数据领域...
标题中的“Python+Spark+Hadoop大数据基于用户画像电影推荐系统毕业源码”指的是一个使用Python、Apache Spark和Apache Hadoop构建的大数据处理项目,旨在实现一个基于用户画像的电影推荐系统。这个系统可能利用大...
基于大数据下Spark快速大数据分析期末课程设计
4-3 Spark机器学习实战 通过实例讲解如何使用Spark MLlib构建机器学习模型,包括分类、回归、聚类等任务。 ### 第5章 企业项目实战:使用Spark机器学习库构建电影推荐引擎 5-1 spark机器学习之推荐引擎1 基于Spark...