`

数据科学研究可用的一些数据集资源整理

阅读更多
数据目录
https://piktochart.com/blog/8-useful-databases-to-dig-for-data/
http://scg.sdsu.edu/sample-data/ 里头的数据比较旧,只适合用于学习研究
https://github.com/caesar0301/awesome-public-datasets  这里的数据多的让人惊叫
数据科学竞赛平台(里头的数据自然不少):
https://tianchi.aliyun.com/
https://www.kaggle.com/
http://www.pkbigdata.com/
斯坦福大学
http://snap.stanford.edu/data/index.html
美国政府
https://catalog.data.gov/dataset?q=lend&sort=views_recent+desc&metadata_type=non-geospatial&as_sfid=AAAAAAVS_gG7FYwDEM7ACEe4YvnDFnRrggsqm9_LoMtjOTQk9-Smul1GMnzbr8baFZEWsNHHtzHZOQNS9NFMJuN9fRqhV0DZaU47a_pjWd9tLpjY_Delne9vrI0jY7obHP5DtYU%3D&as_fid=eea99b8f67057f336b420ab10ffb19fdc1098612&ext_location=&ext_bbox=&ext_prev_extent=-142.03125%2C2.4601811810210052%2C-59.0625%2C58.63121664342478

http://data.un.org
https://www.lendingclub.com/info/download-data.action 借款数据

0
0
分享到:
评论

相关推荐

    部分整理的UCI数据集

    总的来说,UCI数据集是机器学习研究和实践中的宝贵资源,它提供了丰富的数据,促进了算法的开发和比较,推动了数据科学的发展。无论你是初学者还是经验丰富的专业人士,都可以在UCI数据集中找到合适的案例来提升技能...

    机器学习、数据分析数据集八大来源

    这些数据集可能需要一些额外的工作来整理和处理,但通常包含大量未经过滤的真实世界数据。 通过这些数据集来源的介绍,我们可以了解到获取高质量数据集的重要性以及实现该目标的多种途径。不同来源的数据集各有特色...

    1980-2021年中国土地利用覆盖和变化数据集(全新整理)

    通过融合森林资源清查数据和20种遥感土地利用产品,重建生成了1980-2015年中国森林覆盖数据集,空间分辨率1×1公里,再现了1985-2015年间森林覆盖面积增加的趋势,3851个地面调查样本验证结果表明,数据集精度达到...

    1965-2020年逐月中国工业用水空间分布数据集(全新整理)

    1、资源内容地址:https://blog.csdn.net/2301_79696294/article/details/141441484 ...数据集包括工业用水、企业数量和企业生产总值(辅助数据)等变量,可被用于水文、地理学、环境、可持续发展等方面科学研究。

    科学数据共享元数据内容

    - **参照**:与其他数据集或资源的关系。 - **数据模式**:数据的逻辑结构。 - **图示表达**:数据集的可视化表示。 - **扩展**:特定领域的额外元数据要求。 - **限制**:使用数据集的法律和政策约束。 - **维护**...

    数据集的资料.docx

    有效的数据集管理不仅能够提高数据利用率,还能加速科学研究和产品开发的进程。 - **上传数据集的基本流程**:涉及数据的收集、整理、标注、验证以及最终的上传等一系列步骤。这一流程对于数据科学家、工程师及研究...

    (全新整理)中国极端气温指数栅格数据集(1961-2020)

    3、适用对象:大学生,本科生,研究生小白可用,容易上手!!! 3、课程引用,经济学,地理学,城市规划与城市研究,公共政策与管理,社会学,商业与管理 ## 数据指标说明 时间跨度:1961-2020年。 数据集内容包括:...

    数字经济、农业、分省分行业等碳排放数据整理合集(全新整理)

    四、中国粮食生产碳排放量及动态变化数据集(1997-2020) 五、全国各省、各行业8种能源二氧化碳排放量(1994-2021年) 1、分行业二氧化碳排放量 2、分省二氧化碳排放的面板数据(更新!) 六、IPCC碳排放因子数据...

    2022年OSM的水系数据(全国分省市)-江苏省_水系数据集.rar

    标题中的“2022年OSM的水系数据(全国分省市)-江苏省_...总之,2022年OSM的江苏省水系数据集是GIS领域的重要资源,为科研、规划和管理提供了宝贵的信息,其详细程度和更新频率使其在诸多领域中具有广泛的应用价值。

    最新整理-全球冰川湖矢量数据集

    2、数据特点:今年全新,手工精心整理,放心引用,数据来自权威,且标注《数据来源》,相对于其他人的控制变量数据准确很多,适合写论文做实证用 ,不会出现数据造假问题 3、适用对象:大学生,本科生,研究生小白...

    中国大气污染物和二氧化碳排放趋势数据集(2005-2021年)(全新整理)

    本数据集编制了 2005 年至 2021 年中国大陆大气污染物和二氧化碳耦合排放数据集,即 ABaCAS-EI v2.0(空气效益与成本及达标评估系统-排放清单 2.0 版),它是 ABaCAS-EI 的更新版本。该数据集涵盖二氧化碳和 9 类...

    夜间灯光数据 2023年全球/中国夜间灯光数据合集(全新整理)

    2、代码特点:今年全新,手工精心整理,放心引用,数据来自权威,相对于其他人的控制变量数据准确很多,适合写论文做实证用 ,不会出现数据造假问题 3、适用对象:大学生,本科生,研究生小白可用,容易上手!!! 3...

    数据集(2001-2023)(全新整理)

    2、代码特点:今年全新,手工精心整理,放心引用,数据来自权威,相对于其他人的控制变量数据准确很多,适合写论文做实证用 ,不会出现数据造假问题 3、适用对象:大学生,本科生,研究生小白可用,容易上手!!! 3...

    新增数据集-数据集

    5. 数据分析与应用:新增数据集的最终目的是为了进行数据分析,以驱动业务决策或科学研究。可以使用统计方法、机器学习算法或数据可视化工具来探索数据,发现模式、趋势和关联。例如,test5.txt可能是新增数据集的一...

    中国粮食生产碳排放量及动态变化数据集(1997-2020)(全新整理)

    1、资源内容地址:https://blog.csdn.net/2301_79696294/article/details/141282597 2、代码特点:今年全新...数据集存储为.xlsx格式,由1个数据文件组成,数据量为127 KB。 数据信息 存储量:127kB 时间范围:1997年

    (全新整理)中国人均生态足迹、生态福利绩效及驱动因素分解数据集(2001-2020)

    3、适用对象:大学生,本科生,研究生小白可用,容易上手!!! 3、课程引用: 经济学,地理学,城市规划与城市研究,公共政策与管理,社会学,商业与管理 ## 数据指标说明 该数据集内容包括:(1)2001-2020年全国、...

    中国2839个站点逐日降水数据集(0.1°/0.25°/0.5°)(1961-2022年)(全新整理)

    CHM_PRE数据集基于中国境内及周边1961至今共2839个站点的日降水观测,在传统的“降水背景场 + 降水比值场”的数据集构建思路上,尝试应用月值降水约束和地形特征校正,并依据中国范围内约4万个高密度站点2015–2019...

    2005 ~ 2015 年 CERN 光合有效辐射数据集介绍.pdf

    总之,2005年至2015年CERN光合有效辐射数据集是中国乃至全球生态科学研究的重要资源,它提供了长期、大规模的光合有效辐射观测数据,为深入探究地球表面的能量和物质交换过程提供了宝贵的支持。

    2001-2020年中国1km分辨率多时间尺度SPEI数据集(全新整理)

    1、资源内容地址:https://blog.csdn.net/2301_79696294/article/details/141283706 2、代码特点:今年全新,手工精心整理,放心引用,数据来自权威,相对于其他...然而,已有的SPEI数据集存在覆盖范围小、空间不连续或

    (全新整理)机器人相关数据合集1993-2022年

    2、数据特点:今年全新,手工精心整理,放心引用,数据来自权威,且标注《数据来源》,相对于其他人的控制变量数据准确很多,适合写论文做实证用 ,不会出现数据造假问题 3、适用对象:大学生,本科生,研究生小白...

Global site tag (gtag.js) - Google Analytics