`
have_life
  • 浏览: 151532 次
社区版块
存档分类
最新评论

搜狗实验室 提供了一些数据挖掘加工的数据

阅读更多
http://www.sogou.com/labs/resources.html
分享到:
评论

相关推荐

    搜狗实验室新闻数据整理.zip

    【标题】"搜狗实验室新闻数据整理.zip" 提供了一个新闻文本分类的实践平台,重点关注的是自然语言处理(NLP)领域中的文本分类任务。文本分类是NLP的一个基础任务,它涉及到对文本进行自动分类,例如将新闻分为经济...

    机器学习中搜狗实验室发布的搜狗新闻数据集

    机器学习中搜狗实验室发布的搜狗新闻数据集

    搜狗实验室(用户查询日志)

    搜狗实验室(用户查询日志)SogouQ.reduced,用于做大数据分析的数据

    整理后的搜狗实验室全网新闻数据样例(word2vec用)

    用来测试word2vec的数据样本,从搜狗实验室全网新闻数据库http://www.sogou.com/labs/resource/list_news.php 下载并提取出新闻内容的数据。

    搜狗实验室文本(整理版)

    标题 "搜狗实验室文本(整理版)" 暗示我们关注的是来自搜狗实验室的一份数据集,这个数据集经过了整理,很可能是为了便于分析和研究。搜狗实验室作为一个知名的科技研发机构,通常会进行各种语言处理、搜索引擎优化...

    搜狗实验室新闻分类语料库

    搜狗实验室新闻分类语料库是一个重要的数据集,主要用于自然语言处理和机器学习领域的研究,尤其是文本分类和信息检索方面。该语料库包含了丰富的新闻数据,共计50多万条记录,覆盖了十个主要的新闻类别,这些类别...

    搜狗实验室新闻数据 文本分类

    标题中的“搜狗实验室新闻数据 文本分类”指的是一个数据集,这个数据集来源于搜狗实验室,主要用于新闻文本的分类任务。文本分类是自然语言处理(NLP)领域的一个核心问题,它涉及到对大量文本信息进行自动归类,以...

    搜狗实验室 文本分类语料库

    搜狗实验室的文本分类语料库,正是为这一任务提供了大量标注好的训练数据,使得模型能够通过学习这些数据来提高分类准确性。 该语料库可能包含多种类型的文本,比如新闻报道、社交媒体内容、论坛讨论等,这些多样化...

    搜狗实验室文本分类语料

    在这个场景下,"搜狗实验室文本分类语料"是一个专门为了训练和评估文本分类模型而设计的数据集。这个语料库包含了9个不同的类别:财经、互联网、健康、教育、军事、旅游、体育、文化以及招聘,每个类别有1990篇文本...

    复旦大学“大数据挖掘技术”课程项目试图从搜狗实验室用户查询日志数据(2008)

    复旦大学“大数据挖掘技术”课程项目试图从搜狗实验室用户查询日志数据(2008)的搜索记录中识别具有高支持关键字的频繁项集。在实现层面上,我构建了一个由五台服务器组成的微型Hadoop集群

    搜狗实验室技术交流文档 解决socket tcp C10K问题.zip

    标题中的“搜狗实验室技术交流文档 解决socket tcp C10K问题.zip”指的是一个关于如何处理C10K问题的文档合集,这个问题是网络编程中常见的挑战,特别是对于服务器设计者而言。C10K问题指的是一个服务器同时处理10,...

    搜狗实验室文本分类语料库

    文本分类语料库来源于Sohu新闻网站保存的大量经过编辑手工整理与分类的新闻语料与对应的分类信息。...语料库统计的意义:提供一个较大规模的标准中文文本分类测试平台。 应用案例:中文文本分类,主题跟踪与检测等。

    搜狗实验室词典

    词库比较全,可以用于基于机械分词的小型中文分词系统

    搜狗用户画像数据集

    搜狗用户画像,通过搜狗搜索数据来描述用户,进行数据挖掘,使用在大数据精准营销中。 提供用户历史一个月的查询词与用户的人口属性标签(包括性别、年龄、学历)做为训练数据,通过机器学习、数据挖掘技术构建分类...

    搜狗新闻文本分类数据集SougoCS

    SougoCS数据集,内含11类搜狐新闻文本,近10万条。 搜狗提供的数据为未分类的XML格式。 此资源已经将XML解析并分类完毕,方便使用。

    搜狗搜索日志分析报告.docx

    报告的初衷是为了理解用户在搜狗搜索引擎上的行为模式,以帮助企业优化搜索算法,提升用户体验,同时也为市场研究和广告定向提供数据支持。通过数据科学的方法,报告旨在揭示搜索频率、时间分布、关键词偏好、用户...

    1. 搜狗日志查询分析; 2. 运营商关于用户基站停留数据统计; 3. 根据气象数据中心的数据进行温度统计; Hadoop

    选题:搜狗日志查询分析 (MapReduce+Hive综合实验) 前提条件: 安装好hadoop2.8.0 安装好HQL 安装好Hive 安装好eclipse 选题要求: 解压数据源,并上传到hdfs,保存的目录以个人学号区分,176为我的学号 创建hive...

    搜狗语料库搜狗语料库

    搜狗语料库,经验证非常好用。欢迎下载。搜狗语料库,经验证非常好用。欢迎下载。搜狗语料库,经验证非常好用。欢迎下载。

    搜狗分类语料库精简版1

    文本分类语料库来源于Sohu新闻网站保存的大量经过编辑手工整理与分类的新闻语料与对应的分类信息。...语料库统计的意义:提供一个较大规模的标准中文文本分类测试平台。 应用案例:中文文本分类,主题跟踪与检测等。

    搜狗搜索日志分析系统

    "实验参考:搜狗搜索日志分析系统实现-Hadoop2.0-v1.2.docx" 和 "3 实验手册:大数据分析系统实现-Hadoop2.0-v1.2.pdf" 这两份文档提供了实践指南,帮助读者掌握如何运用Hadoop 2.0来搭建和运行搜狗搜索日志分析系统...

Global site tag (gtag.js) - Google Analytics