阅读更多

2顶
0踩

非技术
数据科学、机器学习、大数据分析、认知计算…我们都已被讨论这些主题的文章、技能需求信息图以及各种观点所淹没。有一件事是肯定的:你不可能一夜之间变成一名数据科学家。这注定是一段充满挑战的旅程。但要想成为数据科学家,该怎么开头呢?从哪里着手呢?何时才能看到隧道尽头的亮光呢?学习的路线图是怎样的?我需要掌握哪些工具和技巧?你该如何知道目标实现了没有?

数据可视化对于数据科学非常重要,讽刺的是,对于如何成为数据科学家我却找不到(只找到几个)实用的现成的图示。因此,笔者在本文中尝试建立一个课程体系,一个学习计划供踏上这条旅程的人们使用。受到地铁图的启发,我用这种形式来描绘学习路径。我将整个学习计划按步骤分为一下几个领域

  • 基础知识
  • 统计学
  • 编程
  • 机器学习
  • 文字挖掘/自然语言处理
  • 数据可视化
  • 大数据
  • 数据获取
  • 数据清理
  • 工具集

每个领域用一条“地铁线”表示,而每一个站点表示你必须一步步学会/掌握/理解的各个主题。你选定一条线,上了车,走遍所有的站点(主题),你就会到达终点或是换乘其它线路。我将每个站点(线路)都标上了编号,它表示了你旅行的顺序。你可以将它作为个人学习计划来确定你最想要发展、获得技能的领域。无论如何这都不是终点,这是一个坚实的起点。请畅所欲言并留下建设性的意见。

另:我无意在此计划中引入任何商业工具。此计划大部分内容都基于开源的工具/库。如果你已经获取了商业软件,如IBM的SPSS或SAS的Enterprise Miner,务必坚持下去,此计划依然适用。

另:起初,我是想用D3.js或InfoVis来生成一个互动式可视化图表,但为了早日完工没有实现,也许下次迭代我将完成互动式路线图。

点击查看大图


  • 大小: 560 KB
2
0
评论 共 2 条 请登录后发表评论
2 楼 ezhouwenzi 2015-02-13 10:17
不明觉厉!
1 楼 yidao620c 2015-02-13 10:14
碉堡了。~!!!

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • ToDoList:成为一名优秀数据科学家的道路

    待办事项清单 成为一名优秀数据科学家的道路

  • 如何成为一名数据科学家?

    仅仅在几年前,数据科学家还不是一个正式确定的职业,然而一眨眼的工夫,这个职业就已经被誉为“今后十年IT行业最重要的人才”了。   一、数据科学家的起源 "数据科学"(DataScience)起初叫"...

  • 数据科学修炼手册:成为一名数据科学家应具备哪些品质?

    数据科学家们必须带着具有科学性、创造性和研究性的思维,从各路数据集中提取有用信息,以解决客户面临的潜在挑战。 生活会不断衍生出数据,涉及零售、交通、金融和医疗健康领域。触手可及的各类计算产品和人工...

  • 如何成为一名数据科学家

    如何成为一名数据科学家?文档介绍不错,值得一读。循序渐进。PDF高清

  • DL_with_PyTorch:学习火炬并成为一名数据科学家大师

    DL_with_PyTorch 学习pytorch并成为一名数据科学家大师该存储库中提供了与Jyputer Notebook撰写的每一章相关的编程代码。 欢迎来到深度学习的世界!

  • 【数据科学家】如何成为一名数据科学家?

    仅仅在几年前,数据科学家还不是一个正式确定的职业,然而一眨眼的工夫,这个职业就已经被誉为“今后十年IT行业最重要的人才”了。一、数据科学家的起源"数据科学"(DataSc...

  • 数据科学家是干什么的,成为一名数据科学家,主要划分为哪几个步骤?

    从行业内部的蓬勃发展,到招聘会上HR们的大声宣传,我们都可以看出,数据科学家已经成为当下最炙手可热的职业之一。 行业专业人士分析,未来几年数据科学岗位缺口将达到数百万。不仅仅是顶级科技公司需要数据科学家...

  • 如何从零开始,自学成为一名数据科学家?

    公众号关注“GitHubDaily”设为 “星标”,每天一起学编程!转自机器之心导读:如何通过免费方式学习数据科学?数据科学家 Rebecca Vickery 从技术能...

  • 进阶指南:如何从数据分析师转型为数据科学家?

    大数据文摘出品 ...如何从数据分析师华丽转型,成为一名数据科学家?好比“把大象装进冰箱”,成为“数据科学家”仅需简单三步: 1. 进入LinkedIn登录你的账号。 2. 点击“编辑个人资料”。 3. 将...

  • 【数据科学家】什么是数据科学家? 一个关键的数据分析角色和一个利润丰厚的职业...

    数据科学家的角色因行业而异,但有一些共同的技能、经验、教育和培训可以帮助你在数据科学职业生涯中占据一席之地。什么是数据科学家?数据科学家是分析数据专家,他们使用数据科学从大量结构化和非结构化数据中发现...

  • 如何成为一名数据科学家?(二)

    编者注:作者Alec Smith是数据科学领域中资深HR,之所以写这篇文章是因为经常被问到一个问题:“如何才能获得一份数据科学家的职位?” 不仅这个问题经常被问引起了注意,另外问这个问题的人不同的背景也非常很令人...

  • matlab图像分割肿瘤代码-data_science_info-master:成为数据科学家

    matlab图像分割肿瘤代码数据科学 一个开源的数据科学存储库,用于学习和应用于解决现实...通过8个步骤成为一名数据科学家的直观指南 所需技能的思维导图() 斯瓦米·钱德拉塞卡兰(Swami Chandrasekaran)犯了一个罪名

  • 家庭支出与收入数据数据集,根据人口统计和地理指标进行了分类,加拿大为例,适用于数据分析、机器学习

    这个数据集提供了2010年至2021年间加拿大各省的家庭支出与收入数据,这些数据根据人口统计和地理指标进行了分类。每行代表了年份(REF_DATE)、省份(GEO)以及编码后的支出或收入类型的唯一组合(COORDINATE)。以下是该数据集的关键特点及包含的列信息: 关键特点: 支出数据:家庭支出按照收入五分位数和支出类别进行分类。 收入数据:家庭收入值根据家庭类型、较年长成年人的年龄组别和收入水平细分。 地理位置匿名化:为了保护隐私,原始的地理位置标识符被替换为如“Province 1”这样的标签。 时间序列:涵盖了超过十年的财务数据(2010–2021),适合用于纵向经济和社会趋势分析。 包含的列: REF_DATE:记录年份(2010–2021) GEO:省份标签(例如,“Province 1”) Statistic:度量类型(例如,平均家庭支出) Before-tax household income quintile:税前家庭收入水平分组 Household expenditures, summary-level categories:支出类别 UOM:计量单位 COORD

  • 【锂电池剩余寿命预测】GRU门控循环单元锂电池剩余寿命预测(Matlab完整源码和数据)

    1.【锂电池剩余寿命预测】GRU门控循环单元锂电池剩余寿命预测(Matlab完整源码和数据) 2.数据集:NASA数据集,已经处理好,B0005电池训练、测试; 3.环境准备:Matlab2023b,可读性强; 4.模型描述:GRU门控循环单元在各种各样的问题上表现非常出色,现在被广泛使用。 5.领域描述:近年来,随着锂离子电池的能量密度、功率密度逐渐提升,其安全性能与剩余使用寿命预测变得愈发重要。本代码实现了GRU门控循环单元在该领域的应用。 6.作者介绍:机器学习之心,博客专家认证,机器学习领域创作者,2023博客之星TOP50,主做机器学习和深度学习时序、回归、分类、聚类和降维等程序设计和案例分析,文章底部有博主联系方式。从事Matlab、Python算法仿真工作8年,更多仿真源码、数据集定制私信。

  • 【更新至2024年】2000-2024年各省专利侵权案件结案数数据

    2000-2024年各省专利侵权案件结案数数据 1、时间:2000-2024年 2、来源:国家知识产权J 3、指标:专利侵权案件结案数 4、范围:31省 5、用途:可用于衡量知识产权保护水平

  • HMTL+JS+CSS实现贪吃蛇游戏,包含有一般模式,困难模式,还有无敌模式

    - 使用`<div>` 容器组织游戏界面,包含得分显示、游戏画布和操作按钮 - 支持三种游戏模式选择(一般模式、困难模式、无敌模式) - 移动端和桌面端兼容,提供触摸和键盘两种控制方式 2. CSS样式 : - 采用Flex布局实现页面居中显示 - 使用Grid布局实现方向按钮的排列 - 定义了游戏容器的阴影、圆角等视觉效果 - 为按钮添加了hover效果和过渡动画 3. JavaScript逻辑 : - 使用Canvas API实现游戏渲染 - 实现了蛇的移动、食物生成、碰撞检测等核心游戏逻辑 - 支持三种游戏模式,不同模式对应不同的游戏速度和规则 - 使用localStorage保存最高分记录 - 实现随机颜色生成,使游戏更具趣味性 代码整体结构清晰,功能完整,具有良好的可扩展性和可维护性。

  • 附件2-5:台区智能融合终端入网专业检测送检样品主要元器件清单.docx

    台区终端电科院送检文档

Global site tag (gtag.js) - Google Analytics