`
sillycat
  • 浏览: 2527612 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

Apache Cassandra 2019 and Zeppelin

 
阅读更多
Apache Cassandra 2019 and Zeppelin

Open the interpreter and configure the key configurations.
cassandra.cluster=SillycatCluster
cassandra.hosts=ubuntu-master
cassandra.keyspace=patient
cassandra.native.port=9042

After that, in my notebook, I can do
%cassandra

use patient;
select * from exam where patient_id = 1;

It is pretty useful to look at the data and use the UI.


References:
https://zeppelin.apache.org/docs/0.8.1/interpreter/cassandra.html


分享到:
评论

相关推荐

    Complete Guide to Open Source Big Data Stack

    Source, install, and configure Apache: Brooklyn, Mesos, Kafka, and Zeppelin See how Brooklyn can be used to install Mule ESB on a cluster and Cassandra in the cloud Install and use DCOS for big data ...

    zeppelin-libs:使用 PredictionIO 和 Apache Zeppelin 的机器学习分析

    使用 Zeppelin 的 Scala 笔记本,可以连接到各种数据源,如 HDFS、Cassandra 或 MySQL。加载数据后,可以使用 DataFrame 或 RDD API 进行数据预处理,这是机器学习项目中的重要步骤。 3. **构建模型**: ...

    藏经阁-Using Apache Spark for Intelligent Services.pdf

    Apache Spark 提供了多种数据可视化工具,例如 Apache Zeppelin 等。 四、阿里云中的 Apache Spark 应用 阿里云提供了 Apache Spark 的云端实现,允许用户在云端快速部署和使用 Apache Spark。阿里云中的 Apache ...

    大数据处理的核心技术有哪些?.pdf

    此外,NoSQL 数据库如 MongoDB、Cassandra 和 Apache HBase 提供了对非结构化和半结构化数据的高效存储与管理。 3. **大数据处理**:Apache Hadoop 的 MapReduce 框架是大数据处理的重要组成部分,它将大型任务分解...

    大数据入门资源.doc

    - **Cassandra**:分布式NoSQL数据库系统,适用于处理大量的数据。 - **Elasticsearch**:分布式搜索和分析引擎。 - **Druid**:面向现代数据分析的高性能数据库。 - **Zeppelin**:用于交互式分析和展示数据的Web...

    awesome-spark:很棒的Apache Spark软件包和资源的精选列表

    3. **数据源**:列表中可能包含与Spark集成的各种数据源库,如HDFS、Cassandra、HBase、Amazon S3等,这些库使得Spark能够读取和写入不同存储系统。 4. **可视化和工具**:可能包含用于数据可视化的库和工具,如...

    基于Spark2.2的新闻网大数据实时分析系统设计与实现.zip

    可以使用Apache Zeppelin或Jupyter Notebook结合Matplotlib、Seaborn等库进行交互式数据分析和可视化。 6. **存储与持久化**:处理后的结果通常需要保存到分布式存储系统,如Hadoop HDFS或Cassandra,以便后续查询...

    Sapphirine-Big-Data-Repositories:大数据最终源代码-Big source code

    数据存储则可能涉及Hadoop HDFS或Apache Cassandra等分布式存储系统,它们能够处理海量数据并保证高可用性和容错性。 接下来是数据处理环节,Hadoop MapReduce或Spark可能是其中的关键技术,它们提供了分布式计算...

    Spark AI Summit Europe 2018 全部PPT - part1

    10. **社区贡献与工具**:介绍Spark社区的发展,鼓励参会者参与到开源项目中,同时提及一些辅助开发和管理Spark应用的工具,如Spark JobServer、Zeppelin和Jupyter Notebook等。 通过Spark AI Summit Europe 2018的...

    bigdata:bigdata框架使用演示!

    8. **Apache Zeppelin** 或 **Jupyter Notebook**:这两种工具用于交互式数据分析和可视化,项目可能包含如何创建和运行这些笔记本来探索数据。 9. **MLlib / Spark MLlib**:Spark的机器学习库,项目可能涵盖了从...

    spark-sql数据.rar

    Spark SQL是Apache Spark的一个重要模块,它允许开发者使用SQL或者DataFrame/Dataset API来处理数据。在本项目实例中,我们有一个名为"spark-sql数据.rar"的压缩包,其中包含了与Spark SQL相关的数据集,主要涉及...

    大数据图标大全.docx

    21. **Zeppelin**: 交互式数据分析工具,支持多种语言和框架的笔记本文档,便于数据科学家进行协作。 22. **Flink**: 实时流处理框架,支持事件驱动的实时计算和状态管理。 23. **Mahout**: 基于Apache的机器学习...

Global site tag (gtag.js) - Google Analytics