想体验数据分析却没有环境怎么办?数据科学家集成工作台(Data Scientist Workbench)无疑是您最便利的,而且是免费的平台。
数据科学家集成工作台是一个基于开源的云端“一站式”数据科学分析工作平台,囊括了所有主要的开源工具,例如iPython/Jupyter、RStudio、Apache Zeppelin、OpenRefine等。它提供非常友好的即时交互式学习体验,无需任何本地安装,配置等。关于这个平台的更多介绍,请阅读《数据科学家的实验箱-IBMData Scientist Workbench》或访问官网https://datascientistworkbench.cn/。
Jupyter notebooks 为数据科学家提供了一个基于浏览器的交互式分析环境,数据科学家可以使用Python、Scala或者R进行交互式的开发,来设计分析模型,可视化展现分析结果。Notebooks也使得分析过程可以被保存、导入、导出和共享。
接下我们一起看看如何在数据科学家集成工作台的Jupyter Notebooks进行数据分析:
1. 访问https://datascientistworkbench.cn/网站,免费注册一个账号。
2. 第一次登录,后台将自动创建服务实例。创建完成后请打开Jupyter Notebook,即可开始使用交互式的学习环境进行数据分析:
3. Jupyter Notebook提供了练习教程,引导您快速了解Jupyter Notebook的功能和使用方法。如下面两张图所示,Jupyter Notebook里包含了热门的Spark、SQL、dashDB、DB2、MySQL和PostgreSQL等等。
4. 选中某个Notebook,点击打开。
5. 打开后您即可看到这个Notebook 教程的描述,以及预先准备好的代码。现在,您只需要按顺序选择代码所在的单元格,键入Ctrl+C(运行当前单元格的代码)或Shift+C(运行当前单元格的代码并跳到下个单元格)即可。
您也可以在现有代码基础上进行修改,或插入新的单元格。
6. 除了已有的Notebook 教程,您也可以在Web界面右上角下拉图标选择某种语言新建一个空的Notebook。这个新Notebook可以看成一个新的命令行交互终端。
7. 在哪获取更多的Notebook教程?请参加bigdatauniversity.com.cn的课程,部分课程的实验环境就是数据科学家集成工作台。
不说了,我要去https://datascientistworkbench.cn体验在Jupyter分析数据了!
相关推荐
JupyterHub - 支持多用户服务器版 Jupyter notebooks
A Primer on Using LaTeX in Jupyter Notebooks Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持... 支持使用LaTeX编写数学性说明 ,本资源为在Jupyter Notebooks上编写LaTeX文档提供指导
在IT行业中,Python是一种广泛应用的编程语言,尤其在数据分析、机器学习和Web开发等领域。而Jupyter Notebook是Python的一种交互式环境,它允许用户结合代码、文本、图像和数学公式来创建可执行和可分享的文档。...
它是数据科学家、研究人员和教育者用来探索、分析和展示数据的强大工具。Jupyter Notebook 的核心功能包括: 1. **交互式编程**:在同一个环境中编写 Python 代码,即时运行并查看结果。 2. **Markdown 支持**:...
**Python-Qgrid:在Jupyter Notebooks中的交互式DataFrame管理** 在数据分析和机器学习领域,Jupyter Notebook是一种广泛使用的工具,它提供了交互式环境来编写、运行代码并展示结果。而`Qgrid`库则是Jupyter ...
作为纯Python代码的Jupyter Notebooks,带嵌入式Markdown文本
本文主要介绍了使用Jupyter Notebooks上传文件夹或大量数据到服务器的方法,这对于处理大规模数据集尤其有用。 #### 上传文件夹至服务器的方法 1. **文件压缩与解压** 在处理大量文件时,一种常用的方法是先将...
藏经阁-Taking Jupyter Notebooks and A.pdf
4. **数据预处理**:在构建推荐系统之前,通常需要对数据进行清洗和预处理,包括处理缺失值、异常值,以及转换数据格式,使其适合模型训练。 5. **协同过滤**:这是推荐系统中最常见的方法之一,分为用户-用户协同...
Jupyter Notebook是一种交互式计算环境,允许用户将文本、代码、图表和数据分析结合在一起,非常适合于教学和研究。在这个项目中,每个章节的摘要都是一个独立的Jupyter Notebook,用户可以逐段阅读,同时运行代码,...
**Jupyter Notebook:数据分析的强大工具** Jupyter Notebook是一款开源的Web应用程序,允许用户创建和分享包含代码、文本、数学公式以及可视化元素的交互式文档。它最初设计为Python编程环境,但现在支持超过40种...
Python-Papermill是一款强大的工具,专门设计用于在Jupyter Notebook环境中进行参数化执行和分析。这个工具极大地扩展了Jupyter Notebook的功能,使得开发者和数据科学家能够以自动化的方式运行多个Notebook实例,每...
标题中的“Go-在浏览器中直接渲染Jupyternotebooks而无需后端转换器”意味着我们正在讨论一个使用Go语言实现的项目,它允许用户在浏览器中直接查看和渲染Jupyter Notebook文件,而不需要依赖像Jupyter服务器这样的...
藏经阁-Taking Jupyter Notebooks and Apache Spark to the Next Level
在数据科学、机器学习以及教育领域,Jupyter Notebook已经成为一种广泛使用的工具,它允许用户结合代码、文本、图表和数据分析结果,形成交互式的文档。GitHub则是一个开源代码托管平台,是分享和协作代码的理想场所...
JupyterNotebooks-中
第一版于 2014 年春季运行,这些 Jupyter Notebook 是在 Barba 团队博士生 Olivier Mesnard 的帮助下为该课程准备的。2015 年春季,我们修改并扩展了该系列,增加了学生作业以加强学习体验。该课程还得到了GW SEAS ...
"tag-notebooks" 是一个项目名称,它表明这是一个与Jupyter Notebook相关的工具或库,专门针对Kotlin编程语言进行了优化,并且引入了“TAG”功能。这里的“TAG”可能是为了增强Notebook的组织和管理能力,提供一种更...
通过这个短期课程,参与者将能够熟练地使用Jupyter Notebook进行地球科学的大数据处理和分析,提升他们的科研能力和工作效率。对于那些希望在地球科学领域利用数据科学方法的人来说,这是一个非常有价值的资源。
Papermill 根据我们在数据管道中大规模使用笔记本的经验,对笔记本参数化和执行采取了一种固执己见的方法。 从命令行安装: pip install papermill 对于所有可选的 io 依赖项,您可以指定单独的包,如 s3 或 azure...