kaggle 文本情感分析数据集-iteye

: kaggle 文本情感分析数据集 评分:

kaggle 电影评论情感分析（Bag of Words Meets Bags of Popcorn）的全部数据集，自己上网找了半天都找不到，最后是让同学上外网下的，在这里分享给想学习nlp的同学

kaggle 2018-01-09 上传大小：52.00MB

所需: 43积分/C币立即下载

: 数据挖掘实验分析常用数据集
这是在数据挖掘研究领域，实验时经常用到的数据集，希望对大家有用
立即下载
上传者： caibinlei 时间： 2010-04-16

: Python情感分析文本分类
3实证分析 3.1 数据来源本研究使用的数据集来自Kaggle平台，数据集名称为"Emotions in Text"，可通过以下链接获取：https://www.kaggle.com/datasets/ishantjuyal/emotions-in-text 该数据集包含两列，分别是"Text"和"Emotions"。"Text"列包含文本数据，而"Emotions"列包含了从喜悦、悲伤、爱、惊讶、恐惧到快乐等多种情感类别。根据数据统计结果，本研究使用的数据集包含了不同情感类别的文本样本。以下是各情感类别的样本数量： 1."happy"（喜悦）: 7029 2."sadness"（悲伤）: 6265 3."anger"（愤怒）: 2993 4."fear"（恐惧）: 2652 5."love"（爱）: 1641 6."surprise"（惊讶）: 879 通过对数据集进行统计分析，我们可以观察到不同情感类别的文本样本数量存在差异。这些统计结果为我们提供了有关数据集情感分布的重要信息。在进行情感分类任务时，了解不同情感类别的样本数量可以帮助我们更好地理解数据集的特征，并在构建
立即下载
上传者： weixin_54707168 时间： 2023-08-15

: Python数据分析数据集
这个资源是我在博客文章中所用到的数据集，个人分类是“Python数据分析”。这些数据是kaggle的数据，通过网络爬虫在网上爬取。
立即下载
上传者： qq_37431083 时间： 2019-02-17

: 对twitter上的航空公司评价进行情感分类(kaggle的数据集)_Twitter-airline-se
对twitter上的航空公司评价进行情感分类(kaggle的数据集)_Twitter-airline-sentiment-analysis
立即下载
上传者： 2401_87496566 时间： 2024-10-01

: 50个最佳机器学习公共数据集.doc
在各大网站，精心整理了50个最佳机器学习公共数据集，写在这里免费供大家阅读！
立即下载
上传者： a789865315 时间： 2022-06-12

: Datasets:来自Kaggle的数据集
Datasets:来自Kaggle的数据集
立即下载
上传者： weixin_42097369 时间： 2021-04-01

: Depression_Dataset：从Kaggle.com探索抑郁数据集
Depression_Dataset 从Kaggle.com探索抑郁数据集
立即下载
上传者： weixin_42153615 时间： 2021-02-12

: fake_news_detection:使用Kaggle数据集检测假新闻的简单模型
fake_news_detection 使用Kaggle数据集检测假新闻的简单模型
立即下载
上传者： weixin_42102401 时间： 2021-04-23

: 从kaggle上获取到了2020疫情爆发期间微博的评论数据，该数据集共10000条n-processing.zip
从kaggle上获取到了2020疫情爆发期间微博的评论数据，该数据集共10000条，共有5个维度，分_Text-information-processing
立即下载
上传者： 2401_87496566 时间： 2024-10-02

: kaggle 电影评论文本情感分析（Bag of Words Meets Bags of Popcorn）数据集
kaggle 电影评论文本情感分析（Bag of Words Meets Bags of Popcorn）数据集，和官方的一致。
立即下载
上传者： ustbbsy 时间： 2018-04-24

: Bag of Words Meets Bags of Popcorn数据集
kaggle上的数据集：电影评论文本情感分析（Bag of Words Meets Bags of Popcorn）
立即下载
上传者： qq_39559491 时间： 2018-07-25

: Sentiment Analysis Dataset情感分析数据集
这个数据集名为“Sentiment Analysis Dataset”，来源于Kaggle平台，主要用于情感分析领域的研究。这个数据集的特点是训练数据是通过自动化方式创建的，而不是人工标注推文的情感。具体方法是假设所有包含正面表情符号（如":)"）的推文为正面情感，而包含负面表情符号（如":("）的推文为负面情感。数据集内容包括一个CSV文件，文件中的表情符号已被移除。数据文件格式包含6个字段：推文的情感极性（0 = 负面，2 = 中性，4 = 正面）、推文ID、推文日期、查询词（若无查询词则为NO_QUERY）、发布推文的用户以及推文文本。例如，一个数据行可能如下：情感极性为4（正面）、推文ID为2087、日期为"Sat May 16 23:58:44 UTC 2009"、查询词为"lyx"、用户为"robotickilldozr"、推文内容为"Lyx is cool"。数据集在Kaggle平台上的信息还包括了数据集的上下文、内容描述、致谢、灵感来源以及使用情况等。数据集的许可证为CC0：公共领域，预计每月更新一次。标签包括计算机科学、自然语言处理（NLP）、神经网络等
立即下载
上传者： qq_39671636 时间： 2024-02-01

: kaggle诗歌文本分类数据集NLP
kaggle诗歌分类数据集，用NLP（自然语言处理）方法进行文本分类数据集分为4种诗歌体裁：情感，环境，音乐和死亡根据NLP方法对诗歌体裁进行分类。
立即下载
上传者： zzpl139 时间： 2022-10-30

: MBTI性格类型数据集.zip
Myers Briggs类型（或简称MBTI）是一种个性类型系统，它是世界上最受欢迎的性格测试之一。可将每个人在4个轴上划分为16种不同的个性类型：内向（I）–外向（E）直觉（N）–感觉（S）思维（T）–情感（F）判断（J）–知觉（P）例如，一个 introversion, intuition, thinking 和 perceiving的人将被标记为MBTI系统中的INTP，并且可以根据该标签来建模或描述此人的偏好或行为。内容该数据集包含8600多行数据，每一行都是一个人的数据。用途 1.使用机器学习评估MBTI的有效性以及在线预测语言风格和行为的能力。 2.利用机器学习算法可以尝试根据他们所写的某些文本来确定一个人的性格类型。
立即下载
上传者： baidu_38876334 时间： 2023-06-27

: Python基于BERT和朴素贝叶斯算法的新闻文本分类源码+数据集+实验报告，基于NaiveBayes的新闻情感分类模型
打开data.py，修改第24,25行代码，改成你的数据集/测试集路径 datapath=".\\data\\train.csv" testpath=".\\data\\test.csv" csv文件中，id是样本的序列号，content是新闻的文本内容。comment_all是这个新闻的所有评论。label是新闻真假的标签。其中有3个标签。-1是假新闻，0是不相关，1是真新闻。若要读取excel格式的文档，修改第24,25,34,48行代码即可，但是格式必须相同。其中id是样本的序列号，content是新闻的文本内容。comment_all是这个新闻的所有评论。label是新闻真假的标签。其中有3个标签。-1是假新闻，0是不相关，1是真新闻。打开Bert_train.ipynb或者NaiveBayes.ipynb，运行代码即可。或者直接将以下文件导入kaggle，打开GPU模式，设置好路径之后运行： split_dataset split_tes
立即下载
上传者： 2301_76484015 时间： 2023-04-18

: 烂番茄数据集Rotten Tomatoes
Rotten Tomatoes电影评论数据集是用于情感分析的电影评论语料库。该数据集为句子切片之后的格式，直接用来文本分类之前需要进行清洗。清洗后我会再发一遍。
立即下载
上传者： weixin_41900122 时间： 2022-06-09

: Reddit 用户交互记录【Kaggle竞赛】数据集
该数据包含 25000 名reddit用户针对不同文章的评论时间和标题，数据仅包含三列：reddit用户名、评价文章名和评价时间。注意：数据中没有具体评论的内容。
立即下载
上传者： weixin_38653664 时间： 2021-07-08

: 数据集使用kaggle恐怖小说家身份识别项目数据，集成了主流的文本分类算法_
数据集使用kaggle恐怖小说家身份识别项目数据，集成了主流的文本分类算法_Text-classification-algorithm
立即下载
上传者： 2401_87496566 时间： 2024-10-01

: 一些常用的数据集资源这些数据集涵盖了不同的领域和类型，包括图像、文本、时间序列、医疗数据等，适合各种机器学习和数据分析项目
内容概要：本文提供了涵盖图像识别、自然语言处理、医学等领域常用数据集的介绍与获取方式。它列举了一些重要的开源数据集资源网站及其特点，便于不同研究方向的人群快速检索所需数据进行研究和开发项目。适用人群：研究人员、数据科学家、学生以及任何有数据分析需求的技术工作者。使用场景及目标：适用于寻找图像、文本或医学等相关应用场景的大规模高质量数据集以进行实验模型训练、测试与评估等工作。其他说明：本文有助于加速从理论到实践过程，在各类科学研究和工程实践中提供坚实的支持和帮助。
立即下载
上传者： qq_30220519 时间： 2024-10-07

热门资源标签

上传资源赚钱

Global site tag (gtag.js) - Google Analytics