`
greemranqq
  • 浏览: 975733 次
  • 性别: Icon_minigender_1
  • 来自: 重庆
社区版块
存档分类
最新评论

数据可视化:Zeppelin+spark

阅读更多

一.序言

     最近需要常见数据可视化的东西,主要是方便spark-sql ,方便内部操作方便,因此选择了个数据可视化的,hue 和 zepplin ,hue 是比较强大的,但是spark 方便也是孵化状态,是非apache 的, 先尝试下 Zeppelin 部署,最新0.6的不稳定,编译不过去,就用0.5吧。

     下载地址:https://github.com/apache/incubator-zeppelin/releases

 

二.编译:

     1.解压:

      

tar -zxvf incubator-zeppelin-0.5.0.tar.gz 

 

     2.编译:我是spark1.4.1 +hadoop 2.7.1,0.5 支持到 spark 1.4.0 hadoop 2.6 

    

mvn clean package -Pspark-1.4 -Dspark.version=1.4.1  -Dhadoop.version=2.7.1 -Phadoop-2.6 -DskipTests

 

     如果全部OK 就可以了,按描述的启动就行了:https://github.com/apache/incubator-zeppelin

     

 

三.其他问题:

     因为依赖maven  npm node.js 等,需要自己安装~。~ ,而且版本对应 自己去pom 里面去看看,如果出错,多半就是这个原因了。当然我把我编译好的 拿出来直接用吧,记得配置spark/hadoop home 哦

      下载地址:http://pan.baidu.com/s/1bnhUI6r

 

小结:

       1.这东西因为是孵化项目,变化挺快的,因此稍微麻烦点,纠结纠结就好。

       2.关于一些操作,就看文档吧

 

参考文档

http://zeppelin.incubator.apache.org/:

http://zeppelin.incubator.apache.org/docs/interpreter/spark.html

别人的安装例子:

http://blog.csdn.net/pelick/article/details/45934993

0
1
分享到:
评论

相关推荐

    基于Spark框架的新闻网大数据实时分析可视化系统项目.zip

    数据流向:数据仓库怎么理解?两种东西,其一是IBM微软数据产品为代表的,其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取,写入和管理驻留在分布式存储中的大型数据集。 可以将结构投影到已经存储的...

    数据可视化

    ### 数据可视化:Zeppelin的安装与使用 #### 一、数据可视化概述 数据可视化是一种将数据转换成图形或图像的技术,使人们能够直观地理解数据的含义和趋势。通过使用图表、图形和其他视觉元素,数据可视化可以揭示...

    zeppelin.zip

    Apache Zeppelin 是一个开源的交互式数据分析平台,主要用于大数据处理和可视化。它的核心设计目标是提供一个简单易用、多语言支持的环境,使得数据科学家、分析师和工程师能够方便地进行数据分析、协作和分享。...

    zeppelin-0.8.0-bin-all.tgz

    Apache Zeppelin 是一个开源的交互式数据分析平台,它提供了一个基于Web的笔记本界面,用于数据探索、可视化和协作。Zeppelin 提供了多种语言的解释器,如 SQL、Spark、Python、R 和 Scala,使得用户可以方便地进行...

    藏经阁-nabling Apache Zeppelin_ and Spark_ for Data Science in the

    * 内置可视化支持,能够快速生成报表 * 支持共享和协作工作 Apache Zeppelin 的企业级应用需要解决以下问题: * 安全性问题,例如数据访问控制、身份验证等 * 可扩展性问题,例如增加服务器数量、提高处理速度等 ...

    大数据平台notebook工具-Zeppelin

    Zeppelin 的 Notebook 模式使得数据探索、可视化和协作变得更加直观和高效。 在描述中提到的“zeppelin查询SQL”,指的是 Zeppelin 支持通过 SQL 解释器来查询数据,这对于基于 SQL 的大数据分析尤其有用。用户可以...

    zeppelin-0.8.1-bin-all.tgz

    Apache Zeppelin 是一个开源的交互式数据分析和可视化平台,它为大数据分析提供了便捷的环境,让用户可以通过简单的Web界面进行数据探索。"zeppelin-0.8.1-bin-all.tgz" 是Zeppelin的一个发行版本,包含了所有必要的...

    《Zeppelin&Enterprise;》Jongyoul Lee.pdf

    - **报告生成**:Zeppelin 支持生成丰富的可视化报告,使得业务用户能够更直观地理解数据背后的意义。 - **协作共享**:通过 Zeppelin 的协作功能,团队成员可以共同编辑和分享文档,提高工作效率。 ### 四、总结 ...

    基于Spark、SparkSQL、Hive、Zeppelin构建的NBA历史球员价值挖掘可视化案例+源代码+文档说明

    2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。...

    spark-sql数据.rar

    在分析完成后,可以将结果导出到支持Spark SQL的BI工具,如Tableau或Power BI,进行进一步的数据可视化。此外,Spark SQL也支持直接连接到Jupyter Notebook或Zeppelin,通过Python或Scala的绘图库如matplotlib或...

    zeppelin&说明书.rar

    Apache Zeppelin 是一个开源的交互式数据分析工作台,它提供了丰富的数据可视化和协作功能,广泛应用于大数据处理和分析。在Linux环境下,通过shell脚本来进行一键安装,可以大大简化部署流程,提高效率。本篇文章将...

    一个基于 Web 支持交互式数据分析的软件

    Zeppelin是由Apache基金会开发的一款多语言支持的Web notebook,它的设计目标是使数据探索、可视化和协作变得更加简单。用户可以在浏览器中直接编写和运行代码,支持多种编程语言如SQL、Spark、Python、R等,让数据...

    藏经阁-Enabling Apache Zeppelin and Sp.pdf

    Apache Zeppelin 可以作为一个用户界面,提供交互式的数据分析和可视化功能,而 Apache Spark 则可以作为一个后台引擎,提供高性能的数据处理功能。 四、 Apache Zeppelin 和 Apache Spark 的集成架构 Apache ...

    apache zeppelin使用文档

    Apache Zeppelin 是一款功能强大的基于 Web 的 Notebook 服务器,它为数据科学家提供了一个交互式的环境来探索数据、编写代码并创建可视化报告。Zeppelin 的核心优势在于其灵活的解释器机制,允许用户与各种不同的...

    Hive实战项目数据文件和Zeppelin源文件

    而Zeppelin则是一个交互式的笔记本环境,支持多种语言,包括Hive,用于数据分析和可视化。在这个“Hive实战项目数据文件和Zeppelin源文件”中,我们很显然会涉及到这两个组件的结合使用。 Hive的核心概念包括表、...

    计算机课程毕设:基于Spark2.2的新闻网大数据实时分析系统设计与实现.zip

    5. **结果可视化**:处理后的结果可能通过图表或仪表板进行可视化,帮助用户直观理解分析结果。可能使用的工具有Apache Zeppelin、Jupyter Notebook或自定义Web应用。 6. **部署与扩展**:项目可能涵盖如何将Spark...

    vagrant-spark-zeppelin:Vagrant,Apache Spark和Apache Zeppelin VM,带有用于学习Spark的笔记本

    这个项目利用Vagrant技术创建了一个虚拟机(VM),在这个虚拟环境中预装了Apache Spark和Apache Zeppelin,使得用户可以便捷地进行大数据分析和交互式数据可视化。 【描述】"vagrant-spark-zeppelin" 的核心目的是...

    helium-packages:Zeppelin Helium应用程序的软件包存储库

    Zeppelin是一款开源的交互式数据分析和协作平台,它提供了一种灵活的环境,允许用户通过Web界面进行数据探索、可视化和协作。Helium是Zeppelin的一项特性,它扩展了Zeppelin的功能,允许用户安装和管理各种可插拔的...

Global site tag (gtag.js) - Google Analytics