`

大数据应用场景”之隔壁老王(连载二)

阅读更多
大家的好朋友,我们的好邻居老王时隔一周第二次闪亮登场了!!!上次给大家讲到老王通过小编公司爬虫的帮助找到了合适的合作伙伴,之后生意一直风生水起,但是老王并不满足于现状。当他听说可口可乐通过大数据分析出樱桃味的可乐,并在全世界推出之后,心里一阵窃喜。他的辣条厂想要推出新口味的辣条,请小编帮他分析一下。

第一步:打开爬虫

首先,小编先从微博搜索中搜索到关于正餐,小吃,零食,泡面等的所有信息,采集到的信息文本中,包含一些无关的垃圾信息,如广告等等。

第二步:把垃圾信息塞到分类器中去

但是老王需要的却只是关于这四类食品大众喜欢的口味,这些垃圾信息没有帮助,反而会增加系统的负担。因此需要对这类文本给出垃圾标识。那么怎么来判定是否为垃圾文本呢,小编在分类器里输入了垃圾文本的特征词,如果言论文本属于垃圾文本,则给出垃圾标识。
通过上述步骤,老王在小编的帮助下通过分类器筛选出了全部有关于正餐、小吃、零食、泡面的口味评价。

第三步:把有效信息塞到分类器中去

接着,小编要开始对这些信息进行分类了,也就是说使用前嗅的分类器根据言论的类型,自动对得到的文本打上对应的标签,分到所在的类别里。其中,言论的类别是根据提供的类型确定的,分类器是采用机器学习的方法从大规模标注数据中训练得到的。对于一个输入的言论文本,由N个训练好的分类器分别判断言论是否属于该类别,如泡面的红烧牛肉味、老坛酸菜味等。如果言论文本属于该类别,则给言论打上对应的标签。

通过上述步骤,老王在小编的帮助下通过分类器,将全部有效信息,按照正餐、小吃、零食、泡面的各个口味,进行了精确的分类。

第四步:判断想吃/不想吃

最后也是最重要的一步情感极性分析,也称文本倾向性分析,即判断微博的言论属于想吃、不想吃或者吃不吃都行。用户言论文本的情感极性判断分为两个过程,分别为情感极性模型训练过程和言论文本情感极性判别过程。首先,需要在分类器输入标注好情感极性的言论文本,需要有三类文本:想吃文本、不想吃文本或者吃不吃都行文本。训练好了情感模型可以应用此分类器对言论文本的情感极性进行判断,进行情感极性判断,最后输出的言论文本的情感极性标签:想吃、不想吃或者吃不吃都行。

第五步:关上分类器

把分类器的结果关联到ForeAna数据分析引擎中,就自动得出了可视化图表。

老王拿着结果兴高采烈的跑到了工厂,工人们对这个结果表示十动然拒,并以 ba gong 要挟,如果要出这些口味的辣条,他们就跳槽到某龙辣条厂。。。
0
1
分享到:
评论

相关推荐

    隔壁老王的算法总结笔记

    在“隔壁老王的算法总结笔记”中,我们可以看到他对算法的深入理解和实践。算法是计算机科学的灵魂,它是一系列解决问题的明确指令,是编写程序的基础。这份笔记涵盖了一系列常见的算法,旨在帮助读者提升编程技能和...

    大数据技术2015最新面试题

    MapReduce则是并行处理大数据的计算模型,将大任务分解为小任务并行执行,适合批处理场景。 Spark是另一种分布式计算框架,它在内存计算方面表现出色,相比Hadoop MapReduce具有更高的计算速度。Spark支持多种计算...

    根据忠厚老实的老王的二次规划平滑参考线建模,使用c++语言调用OSQP库复现.zip

    源码是经过本地编译可运行的,下载完成之后配置相应环境即可使用。源码功能都是经过老师肯定的,都能满足要求,有需要放心下载即可 源码是经过本地编译可运行的,下载完成之后配置相应环境即可使用。...

    老王Python基础+进阶+项目篇(高清无密)

    项目篇3-django web编程扫盲之二 项目篇4-django数据库操作第一节 项目篇5-django数据库操作第二节 项目篇6-django速攻之数据提交,显示 项目篇7-django速攻之衔接 项目篇8-tornado第一节扫盲篇 项目篇9-tornado第二...

    老王python整理的价值300元的python学习教程(上册).zip

    这些例子覆盖了各种场景,包括基本运算、数据结构操作、文件处理、函数应用等,是提高编程实践能力的好材料。 总之,《老王python整理的价值300元的python学习教程(上册)》是一个全面的Python学习资源集合,从基础...

    大数据时代的裸奔.docx

    大数据的广泛应用同时也引发了隐私权的讨论。随着个人信息的广泛收集和分析,个人隐私的保护成为一个亟待解决的问题。如同故事中提到的学生担忧,大数据可能揭示个人的敏感信息,如性取向,甚至可能导致个人信息的...

    老王2018Linux运维.zip

    【标题】"老王2018Linux运维.zip"是一个包含有关2018年Linux运维实践的压缩文件,很可能是由经验丰富的IT专家“老王”编写的教程或笔记。这个压缩包聚焦于Linux系统的管理和维护,是针对那些希望提升在Linux环境下...

    老王python视频完整教程

    ### 老王Python视频完整教程知识点概览 #### 一、Python基础知识 1. **Python简介**: - Python的发展历史与应用领域。 - Python与其他编程语言的区别。 2. **安装配置**: - 如何下载并安装Python。 - 配置...

    政务大数据治理平台_用户操作手册.pdf

    根据提供的文件信息,本篇知识点将围绕“政务大数据治理平台”的用户操作手册展开。由于手册内容详尽,知识点将会涵盖项目概述、平台功能、操作细节等几个主要方面。 首先,项目概述部分介绍了用户手册的编写目的、...

    老王练习题及答案精选.doc

    "老王练习题及答案精选" 本文档是关于《老王》的练习题及答案精选,分为八个部分,涵盖了语文知识点、文学分析和语言运用等方面。 一、积累运用 本部分旨在考察学生对《老王》的词汇和语法知识。涉及到加点字注音...

    老王python基础进阶项目

    “老王python基础进阶项目”这套教程通过全面而系统的讲解,不仅涵盖了Python的基础语法和概念,还深入探讨了进阶技术和实际应用场景,适合初学者快速入门并逐步提升至更高水平。对于希望从事软件开发、数据分析等...

    《老王》评课记录.doc

    这篇评课记录主要围绕《老王》这篇课文的课堂教学展开,涉及了多个教育知识点和教学策略。以下是根据记录内容提炼出的关键知识点: 1. **教学方法的改革**:传统教学方式常常是教师单方面讲解,学生被动接受。王...

    9老王.ppt

    9老王.ppt

    ChatGPT 基础教程(四):ChatGPT 的应用场景(一)

    前面我们介绍了 ChatGPT , 也教了大家怎么去提问,可能很多人会用了,但是不知道用在哪里,今天这篇文章,就是介绍一下 ChatGPT 的一些基础应用场景,让大家知道 ChatGPT 原来可以这样用。 1. 文献、论文的应用 2. ...

    《老王的数字化转型之路》

    初步探索:老王开始研究如何将IT技术应用到自己的公司中,他咨询了IT顾问,并开始了解云计算、大数据分析和物联网等概念。 实施计划:老王决定从引入企业资源规划(ERP)系统开始,以整合公司的财务、人力资源、供应...

    老王讲lt资源.rar

    【标题】"老王讲lt资源.rar"是一个压缩文件,其中包含了关于“老王讲lt”的教育资源。这个标题暗示我们,这可能是一系列由“老王”提供的关于“lt”技术或概念的讲解资料,而“lt”在这里可能是某种编程语言、技术...

    老王python进阶项目

    从“老王python进阶项目”的标题和描述中可以提炼出一些重要的知识点,这些知识点不仅涵盖了Python的基础知识,还涉及到了一些进阶的学习内容。接下来,我们将深入探讨这些知识点,并尽可能提供详尽的信息。 ### ...

Global site tag (gtag.js) - Google Analytics