`
andyliuxs
  • 浏览: 138461 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

有关情感分析和观点挖掘的几个概念(转)

阅读更多
  • 情感和主观观点分类(sentiment and subjectivity classification):情感分析(sentiment analysis)就是一个文本分类(text classification)问题,主要有两个级别:
    • 文档级别的分类:含有主观观点的文章表达的是正面的还是负面的观点(positive or negative opinion),有个专用名词表示这一类sentiment classification或者document-level sentiment classification
    • 句子级别的分类:主要目的
      • 句子表述的意思是主观的还是客观的,表示这一类的专用名词:subjectivity classification或者subjectivity/objectivity identification
      • 如果是主观的,是正面的还是负面的,还是中性的,表示这一类的专用名词:sentence-level sentiment classification
  • 基于特征的情感分析(feature-based sentiment analysis):做情感分析前首先要找出某观点针对什么目标所发,例如,目标可以是某产品、产品的部件、产品的特征、产品的属性等等,上述目标也可以 推及商品、服务、个人、组织、事件、话题等等。实际上也可以作为情感分析的除文档级别和句子级别以外的第三个级别。
  • 直接观点和对比观点
    • 直接观点:direct opinion或者direct appraisal,例如,The picture quality of this camera is poor
    • 对比观点:comparative opinion,例如,The picture quality of this camera is better than that of Camera-x。进行这类情感分析时,首先要确定观点的目标对象是谁。
  • 观点搜索和检索:opinion search and retrieval
  • 极性分类(polarity classification)和星级评分(multi-way scale):参看维 基百科,极性分类就是分成正面、负面或者中性,而星级评分分成的级别更多,例如, 1~5星级。
  • 垃圾观点(opinion spam)和观点效用值(utility of opinions):垃圾观点是为了故意误导读者或者自动信息处理系统而发布的虚假观点。所以应该为观点的效用进行评级。例如,刚刚发布的新闻大众点评网公正性受质疑,如果再加上:“保留好评差评是否存在“双重标准”?”,以及有中国特色的“删差团”和 “找公关渠道删除”,都给情感分析造成了很大障碍。

 

分享到:
评论

相关推荐

    情感分析 数据挖掘

    文本情感计算主要包括以下几个方面: 1. **词语的情感倾向**:识别文本中的情感词汇,并确定其正面或负面的情感极性。 - **情感词汇表**:建立一个包含大量情感词汇及其极性评分的列表。 - **情感词汇的上下文...

    文本情感分析

    文本情感计算的实现涉及几个关键领域: 1. 词或短语的情感倾向:识别具有情感色彩的词汇或短语,这些词汇或短语能够影响句子或文档的情感倾向。 2. 文档与句子的情感倾向:综合考虑文档或句子中的所有情感元素,...

    基于数据挖掘的舆情观点挖掘研究.pdf

    在标题《基于数据挖掘的舆情观点挖掘研究.pdf》中,我们看到了两个主要概念:数据挖掘和舆情观点挖掘。首先,数据挖掘是指从大量数据中通过算法和统计学方法寻找模式的过程。这一过程的目标是从数据库中提取有用的...

    基于SVM算法的航天微博情感分析.pdf

    在展开讨论标题“基于SVM算法的航天微博情感分析”的相关知识点之前,我们需要了解几个关键概念:SVM算法、情感分析、航天微博以及它们如何结合使用。 首先,SVM,即支持向量机(Support Vector Machine)算法,是...

    知网Hownet情感词典.zip

    用户可以根据需求选择合适的文件进行加载和使用,这对于开发情感分析算法、构建情感分析模型或者进行情感导向的文本挖掘都是非常有价值的资源。 总的来说,知网Hownet情感词典是NLP领域的重要参考资料,它提供了...

    行业分类-设备装置-挖掘社交媒体以用于紫外线照射分析.zip

    标题中的“行业分类-设备装置-挖掘社交媒体以用于...总的来说,这个主题涵盖了IT技术在跨学科领域的应用,结合了大数据、社交媒体分析和环境健康等多方面的知识,对于理解公众行为、提高公众健康意识具有重要意义。

    情感词汇本体

    情感本体通常由以下几个核心组成部分构成: 1. **情感词汇**:这是本体的基础,包括各种正面、负面和中性情感的词汇。这些词汇可能来自专业的情感词典,也可能通过机器学习方法从大量文本中自动提取。 2. **情感...

    文本挖掘技术——北大杨建武教授

    文本情感分析是通过计算机程序来识别和量化文本中的主观信息,如情绪、态度和观点。在商业应用中,它常用于市场研究、品牌管理和客户服务,以了解消费者对产品或服务的感受。杨教授可能讲解了以下几点: 1. 情感...

    情感分析的新评论及其方法-研究论文

    情感分析通常涉及以下几个核心概念: 1. 极性(Polarity):指的是文本所表达的情感倾向,可以是正面的、负面的,或者是中立的。 2. 数据准备(Data Preparation):这是情感分析的第一步,涉及到收集来自不同来源...

    2021031104_面向新冠疫情的大学校园的舆情分析平台.rar

    舆情是指公众对某一事件或问题的普遍看法和态度,而舆情分析则是通过技术手段收集、整理、挖掘这些观点,分析其趋势、情绪和影响力。在新冠疫情背景下,大学校园的舆情可能涉及疫情防控政策、学生健康状况、教学模式...

    统计自然语言处理宗成庆主编NLP课件.rar

    7. **情感分析与意见挖掘**:情感分析旨在识别和提取文本中的情绪色彩,常用于产品评论分析或舆情监控。而意见挖掘则更深入,涉及识别观点、评价对象和评价极性。 8. **实体识别与关系抽取**:这两项任务是信息抽取...

    一种基于领域语义关系图的短文本实时分析模型

    该模型主要由以下几个关键部分组成: 1. **数据采集**:首先,利用爬虫技术从网络平台抓取特定领域的文本数据。爬虫技术是网络信息获取的重要工具,可以自动化地遍历和下载网页内容,为后续的分析提供基础数据。 2...

    宗成庆自然语言处理PPT

    在宗成庆教授的PPT中,我们可以期待涵盖以下几个关键知识点: 1. **基础理论**:首先,会介绍语言学的基本概念,包括语法、语义和语用学,为后续的NLP技术打下理论基础。 2. **文本表示与预处理**:这部分可能会...

    成功背后记叙文8篇.docx

    根据给定文件的信息,我们可以从中提炼出几个关键的IT技术和概念并不适用,因为这份文档主要讲述的是关于成功的背后故事和个人经历。但是,如果我们要从文本处理的角度出发,我们可以探讨一些与此文档相关的技术应用...

    网络游戏-游戏舆情的检测方法及系统.zip

    《网络游戏-游戏舆情的检测方法及系统》是一个深入探讨网络游戏领域舆情监测的专题资料,主要关注如何有效地管理和分析网络上关于游戏的相关舆论信息。在这个信息化时代,网络游戏已经成为人们娱乐生活的重要组成...

    如何促进对“闲人”的深度学习——重教《记承天寺夜游》.pdf

    首先,文章标题中的“闲人”指的是苏轼《记承天寺夜游》中的主体思想和意境,这个概念并非表面上的闲散之人,而是有着深层次的文化内涵和作者的个人情感。通过重新教授《记承天寺夜游》这篇课文,教师刘自歆和邢俊...

    大数据+网络爬虫+数据可视化

    这些评论数量庞大,包含丰富的用户观点和情感信息,通过大数据技术可以挖掘出观众的喜好、评价趋势等有价值的信息。 2. 网络爬虫:网络爬虫是一种自动化程序,用于抓取互联网上的信息。在这个项目中,网络爬虫被...

Global site tag (gtag.js) - Google Analytics