zip文件

kaggle 文本情感分析数据集 评分:

kaggle 电影评论情感分析(Bag of Words Meets Bags of Popcorn)的全部数据集,自己上网找了半天都找不到,最后是让同学上外网下的,在这里分享给想学习nlp的同学
2018-01-09 上传 大小:52.00MB
立即下载
其他文档
数据挖掘实验分析常用数据集

这是在数据挖掘研究领域,实验时经常用到的数据集,希望对大家有用

立即下载
zip文件
Python情感分析文本分类

3实证分析 3.1 数据来源 本研究使用的数据集来自Kaggle平台,数据集名称为"Emotions in Text",可通过以下链接获取:https://www.kaggle.com/datasets/ishantjuyal/emotions-in-text 该数据集包含两列,分别是"Text"和"Emotions"。"Text"列包含文本数据,而"Emotions"列包含了从喜悦、悲伤、爱、惊讶、恐惧到快乐等多种情感类别。 根据数据统计结果,本研究使用的数据集包含了不同情感类别的文本样本。以下是各情感类别的样本数量: 1."happy"(喜悦): 7029 2."sadness"(悲伤): 6265 3."anger"(愤怒): 2993 4."fear"(恐惧): 2652 5."love"(爱): 1641 6."surprise"(惊讶): 879 通过对数据集进行统计分析,我们可以观察到不同情感类别的文本样本数量存在差异。这些统计结果为我们提供了有关数据集情感分布的重要信息。在进行情感分类任务时,了解不同情感类别的样本数量可以帮助我们更好地理解数据集的特征,并在构建

立即下载
zip文件
Python数据分析 数据集

这个资源是我在博客文章中所用到的数据集,个人分类是“Python数据分析”。这些数据是kaggle的数据,通过网络爬虫在网上爬取。

立即下载
zip文件
对twitter上的航空公司评价进行情感分类(kaggle的数据集)_Twitter-airline-se

对twitter上的航空公司评价进行情感分类(kaggle的数据集)_Twitter-airline-sentiment-analysis

立即下载
doc文件
50个最佳机器学习公共数据集.doc

在各大网站,精心整理了50个最佳机器学习公共数据集,写在这里免费供大家阅读!

立即下载
zip文件
Datasets:来自Kaggle的数据集

Datasets:来自Kaggle的数据集

立即下载
zip文件
Depression_Dataset:从Kaggle.com探索抑郁数据集

Depression_Dataset 从Kaggle.com探索抑郁数据集

立即下载
zip文件
fake_news_detection:使用Kaggle数据集检测假新闻的简单模型

fake_news_detection 使用Kaggle数据集检测假新闻的简单模型

立即下载
zip文件
从kaggle上获取到了2020疫情爆发期间微博的评论数据,该数据集共10000条n-processing.zip

从kaggle上获取到了2020疫情爆发期间微博的评论数据,该数据集共10000条,共有5个维度,分_Text-information-processing

立即下载
zip文件
kaggle 电影评论文本情感分析(Bag of Words Meets Bags of Popcorn)数据集

kaggle 电影评论文本情感分析(Bag of Words Meets Bags of Popcorn)数据集,和官方的一致。

立即下载
rar文件
Bag of Words Meets Bags of Popcorn数据集

kaggle上的数据集: 电影评论文本情感分析(Bag of Words Meets Bags of Popcorn)

立即下载
zip文件
Sentiment Analysis Dataset情感分析数据集

这个数据集名为“Sentiment Analysis Dataset”,来源于Kaggle平台,主要用于情感分析领域的研究。这个数据集的特点是训练数据是通过自动化方式创建的,而不是人工标注推文的情感。具体方法是假设所有包含正面表情符号(如":)")的推文为正面情感,而包含负面表情符号(如":(")的推文为负面情感。 数据集内容包括一个CSV文件,文件中的表情符号已被移除。数据文件格式包含6个字段:推文的情感极性(0 = 负面,2 = 中性,4 = 正面)、推文ID、推文日期、查询词(若无查询词则为NO_QUERY)、发布推文的用户以及推文文本。例如,一个数据行可能如下:情感极性为4(正面)、推文ID为2087、日期为"Sat May 16 23:58:44 UTC 2009"、查询词为"lyx"、用户为"robotickilldozr"、推文内容为"Lyx is cool"。 数据集在Kaggle平台上的信息还包括了数据集的上下文、内容描述、致谢、灵感来源以及使用情况等。数据集的许可证为CC0:公共领域,预计每月更新一次。标签包括计算机科学、自然语言处理(NLP)、神经网络等

立即下载
zip文件
kaggle诗歌文本分类数据集NLP

kaggle诗歌分类数据集,用NLP(自然语言处理)方法进行文本分类 数据集分为4种诗歌体裁:情感,环境,音乐和死亡 根据NLP方法对诗歌体裁进行分类。

立即下载
zip文件
MBTI性格类型数据集.zip

Myers Briggs类型(或简称MBTI)是一种个性类型系统,它是世界上最受欢迎的性格测试之一。可将每个人在4个轴上划分为16种不同的个性类型: 内向(I)–外向(E) 直觉(N)–感觉(S) 思维(T)–情感(F) 判断(J)–知觉(P) 例如,一个 introversion, intuition, thinking 和 perceiving的 人将被标记为MBTI系统中的INTP,并且可以根据该标签来建模或描述此人的偏好或行为。 内容 该数据集包含8600多行数据,每一行都是一个人的数据。 用途 1.使用机器学习评估MBTI的有效性以及在线预测语言风格和行为的能力。 2.利用机器学习算法可以尝试根据他们所写的某些文本来确定一个人的性格类型。

立即下载
zip文件
Python基于BERT和朴素贝叶斯算法的新闻文本分类源码+数据集+实验报告,基于NaiveBayes的新闻情感分类模型

打开data.py,修改第24,25行代码,改成你的数据集/测试集路径 datapath=".\\data\\train.csv" testpath=".\\data\\test.csv" csv文件中,id是样本的序列号,content是新闻的文本内容。comment_all是这个新闻 的所有评论。label是新闻真假的标签。其中有3个标签。-1是假新闻,0是不相关,1是真新闻。 若要读取excel格式的文档,修改第24,25,34,48行代码即可,但是格式必须相同。 其中id是样本的序列号,content是新闻的文本内容。comment_all是这个新闻的所有评论。label是新闻真假的标签。其中有3个标签。-1是假新闻,0是不相关,1是真新闻。 打开Bert_train.ipynb或者NaiveBayes.ipynb,运行代码即可。 或者直接将以下文件导入kaggle,打开GPU模式,设置好路径之后运行: split_dataset split_tes

立即下载
zip文件
烂番茄数据集Rotten Tomatoes

Rotten Tomatoes电影评论数据集是用于情感分析的电影评论语料库。 该数据集为句子切片之后的格式,直接用来文本分类之前需要进行清洗。 清洗后我会再发一遍。

立即下载
zip文件
Reddit 用户交互记录【Kaggle竞赛】数据集

该数据包含 25000 名reddit用户针对不同文章的评论时间和标题,数据仅包含三列:reddit用户名、评价文章名和评价时间。注意:数据中没有具体评论的内容。

立即下载
zip文件
数据集使用kaggle恐怖小说家身份识别项目数据,集成了主流的文本分类算法_

数据集使用kaggle恐怖小说家身份识别项目数据,集成了主流的文本分类算法_Text-classification-algorithm

立即下载
txt文件
一些常用的数据集资源 这些数据集涵盖了不同的领域和类型,包括图像、文本、时间序列、医疗数据等,适合各种机器学习和数据分析项目

内容概要:本文提供了涵盖图像识别、自然语言处理、医学等领域常用数据集的介绍与获取方式。它列举了一些重要的开源数据集资源网站及其特点,便于不同研究方向的人群快速检索所需数据进行研究和开发项目。 适用人群:研究人员、数据科学家、学生以及任何有数据分析需求的技术工作者。 使用场景及目标:适用于寻找图像、文本或医学等相关应用场景的大规模高质量数据集以进行实验模型训练、测试与评估等工作。 其他说明:本文有助于加速从理论到实践过程,在各类科学研究和工程实践中提供坚实的支持和帮助。

立即下载
热门资源标签
Global site tag (gtag.js) - Google Analytics