`

MaxCompute在网络舆情监控系统中的应用

阅读更多
原文链接:http://click.aliyun.com/m/26461/
摘要: 基于阿里云MaxCompute和其他云服务自建网络舆情监控平台的一些分享

背景介绍
根据中国互联网络信息中心(CNNIC)报告显示,我国的网民规模增长迅猛,截至2016年12月,我国网民规模达7.31亿,较2015年底提升了6.52个百分点。互联网成为反映社会舆情的一个重要载体。随着以社交媒体为主的互联网应用的普及和深入,网络舆情热点层出不穷,特别是当前微博、微信、新闻客户端等新媒体发展极为迅猛,其强大的舆论号召力与传播力让任何人都无法轻视。互联网已经成为政府了解民情的直接渠道,同时也成为企业接触客户、宣传营销的重要阵地。

国内某汽车企业所搭建的网络舆情监控平台,通过建设互联网媒体舆情综合监测分析系统,对新闻、论坛、博客、微博、视频、APP、传统纸媒等进行全面的覆盖,客户可以及时获取与自己关心的网络舆情信息,及时挖掘出网络舆情热点信息和背后的网络推手并进行持续的监控和跟踪,对舆情信息进行深度挖掘,发现潜在的舆情热点,对于特定的舆情事件可以及时提供分析报告。

需求概要
业务部门对舆情监控平台要求的高实时性(刷新频率在5分钟以内),方便的自行添加监控内容,能监控媒体及不同编辑对品牌和产品的友好度,并且内快速的形成相关的舆情报告。基于业务部门的要求情况,系统没有采用阿里云现有的舆情监控服务,而是使用阿里云ECS和MaxCompute服务搭建了一套基于爬虫和自然语言分析的舆情系统,已满足业务部门个性化的需求。

系统设计
3177bf1d1f1e9722f40e9acc034fec53a5e5a084
系统架构图

02fdc6e9eeac304330c8274f90c2777e1c4ce36a
业务架构

8a4731b36b55dfe0fef3eb649c568559c7b2db20
系统拓扑图

前端请求SLB进行负载均衡,下发到2个Web子系统,主要的数据处理工作由MaxCompute完成,搜索引擎使用3台ECS部署了ES来承载,数据收集则由多个爬虫系统完成,同时也有一台ECS用户自然语言处理,相关的结构化数据存储则由RDS提供。

爬虫系统和自然语言处理不在本文中详细介绍,主要介绍MaxCompute中数据处理的相关内容。



相关MaxCompute任务根据功能分为几类:模型训练、竞品分析、舆情监控、媒体分析、预警中心和事件分析等。

相关任务截图:

f3e9dc3ad5d31db81f15982f17b6680786438ebb
主要的几类任务介绍

模型训练任务

关键词监控:主要是通过使用MR任务使用TF-IDF的统计方法,同时使用MR进行去过滤。

计算词向量:通过数加平台的机器学习功能,将相关关键字进行数字化的工作。

6af808434aeea1460df01e2528c9998d46187d32
关键词监控工作流

舆情监控任务

包含信息去重、去水军信息、计算统计数据等任务

9115822ee13823694e4fd3f7c60bf28c06af50db
计算统计数据工作流

媒体分析类:活跃媒体统计、媒体品牌统计、去重过滤类等任务,其他任务包括热词统计、关键词同步、热点新闻统计等,通过DataIDE进行自动调度

938db842022ee414034ef995c487369545df3100
任务运行概览

监控结果
6c706eb93d5fc76c2806efe624ef8671d7dea55b

监控概览

c74aeb7bcd4a4d27040080173e084e39e1d6e3bc

舆情监控

bc3f2bea6cbcdda1e6ba3c6080dc354e72fe49df

媒体分析

目前该系统已上线3个月,满足的业务部门目前的监控需求,而且在时效性和精准性方面明显优于第三方监测公司的报告。
原文链接:http://click.aliyun.com/m/26461/
分享到:
评论

相关推荐

    基于JavaEE的网络舆情监控系统设计

    针对高校思政管理工作中较难对学生的网络舆论情况进行实时监控的问题,文中基于JavaEE技术,设计开发了一款网络舆情的实时监控系统。该系统使用网络爬虫、文本信息处理、语义分析等大数据处理技术,从而实现对学生...

    舆情监控系统分析对比.xlsx

    舆情监控系统,Rank网络舆情监测系统,帕拉斯网络舆情监控系统,红麦软件舆情监测系统,Goonie网络舆情监控系统,鹰隼网络舆情监控系统,军犬网络舆情监控系统,麦知讯网络舆情监控系统,"百度指数舆情监控分析 ","清博新...

    基于Java的开源免费舆情监测网络监控系统设计源码

    本资源提供了一套基于Java语言编写的开源免费舆情监测网络监控系统设计源码。该项目包含了3436个JavaScript文件、352个PNG图像文件、274个CSS样式文件、272个SVG图形文件、235个Java源文件、129个HTML文件、61个JPG...

    舆情监控系统介绍.pdf

    舆情监控系统是一种用于收集、分析和管理网络上公众舆论的工具,主要帮助企业、政府机构和其他组织及时了解并应对公众对特定事件、品牌或政策的看法。本文将详细介绍这种系统的各个方面。 1. **系统简介** 舆情...

    政府网络舆情监控系统的实现终稿.pdf

    政府网络舆情监控系统的实现终稿.pdf

    基于python的网络舆情分析系统源码+文档说明(毕业设计)

    基于python的网络舆情分析系统源码+文档说明(毕业设计)基于python的网络舆情分析系统源码+文档说明(毕业设计)基于python的网络舆情分析系统源码+文档说明(毕业设计)基于python的网络舆情分析系统源码+文档说明...

    基于python的网络舆情分析系统源码数据库论文.docx

    在系统的设计和实现部分,作者详细介绍了基于Python语言和MySQL数据库的网络舆情分析系统的设计和实现过程。该系统使用Python语言作为开发语言,MySQL数据库作为数据存储介质。该系统的主要功能包括言论分析、言论...

    基于事件的网络舆情分析系统源码+项目说明.zip

    基于事件的网络舆情分析系统源码+项目说明.zip基于事件的网络舆情分析系统源码+项目说明.zip基于事件的网络舆情分析系统源码+项目说明.zip基于事件的网络舆情分析系统源码+项目说明.zip基于事件的网络舆情分析系统...

    基于大数据的网络舆情监控系统设计探析.pdf

    首先,大数据在网络舆情监控系统中的作用体现在数据的获取、存储和分析。系统通常采用分布式存储框架如HDFS,确保数据的高效获取和存储。HBase作为数据存储结构,支持大规模非结构化数据的管理。同时,系统通过全文...

    互联网+网络舆情监控系统建设方案.ppt

    互联网+网络舆情监控系统建设方案

    基于云计算和Hadoop的网络舆情监控系统设计.pdf

    综上所述,本篇文章详细介绍了基于云计算和Hadoop技术设计的网络舆情监控系统的设计理念、系统架构及各模块功能,并强调了该系统在大学生舆情管理中的应用价值。通过结合现代大数据处理技术和云计算平台,该系统旨在...

    1舆情监控系统.docx

    1舆情监控系统 舆情监控系统 设 计 方 案 1舆情监控系统全文共19页,当前为第1页。 1舆情监控系统全文共19页,当前为第1页。 目录 目录 一、背景概述 3 二、建设必要性 4 三、建设目标 4 四、核心技术 5 五、系统...

    网络舆情监控系统的实现方法_何佳2

    《网络舆情监控系统的实现方法》这篇文章探讨了在网络时代如何运用信息通信技术和中文信息处理技术来构建网络舆情监控系统。舆情监控对于现代社会具有重要意义,尤其是在中国,根据中国互联网络信息中心(CNNIC)的...

    毕业设计javajsp网络舆情监控系统mysql-qrp源码含文档工具包

    毕业设计javajsp网络舆情监控系统mysql-qrp源码含文档工具包 页面是jsp,数据库mysql,jdk1.8,开发工具用ecplise、myecplise、sts、idea都可以 帮助中心 查询舆情 添加舆情 我的舆情库 删除舆情 即时采集 网络舆情...

    《瞬速互联网舆情监控系统》用户手册.pdf

    《瞬速互联网舆情监控系统》用户手册主要涵盖了该系统的基本信息、功能特点、使用方法以及相关的监测示例和成功案例,旨在帮助用户更好地理解和操作这一系统。以下是对这些内容的详细解析: 1. 软件背景:这部分...

    p003基于爬虫与文本挖掘的网络舆情监控系统-flask.zip

    基于爬虫与文本挖掘的网络舆情监控系统是一款先进的工具,旨在实时监测和分析互联网上的舆论动态。该系统利用强大的爬虫技术从各种网络资源中获取数据,然后通过文本挖掘算法对数据进行深入处理和分析,以揭示网络上...

    基于大数据的网络舆情监控系统设计探析.docx

    网络舆情监控系统是当今互联网时代的重要工具,尤其在大数据背景下,网络舆情的复杂性和传播速度都提出了新的挑战。本文主要探讨了如何设计一个基于大数据的网络舆情监控系统,以有效地管理和应对网络舆情危机,保障...

Global site tag (gtag.js) - Google Analytics