Spark Zeppelin and Elasticsearch
Open Zeppelin and select ‘Interpreter’
Visit this URL to get more information about my Elastisearch cluster
http://ubuntu-master:9200/
Configure these informations
elasticsearch.client.type = transport
elasticsearch.cluster.name = sillycatcluster
elasticsearch.host = ubuntu-master
elasticsearch.port = 9300
elasticsearch.result.size = 100
Save the config and restart the interpreter
Create a new notebook use Elasticsearch as default or put %elasticsearch
I saw this logging in Elasticsearch
[2019-06-06T18:48:27,637][WARN ][o.e.t.TcpTransport ] [elastic1] exception caught on transport layer [Netty4TcpChannel{localAddress=/192.168.56.101:9300, remoteAddress=/192.168.56.101:46928}], closing connection
java.lang.IllegalStateException: Received message from unsupported version: [2.0.0] minimal compatible version is: [6.7.0]
It seems that the interpreter is too old.
References:
http://zeppelin.apache.org/docs/0.8.0/interpreter/elasticsearch.html
https://community.hortonworks.com/articles/54755/enabling-the-zeppelin-elasticsearch-interpreter.html
分享到:
相关推荐
- **Elasticsearch:** A search and analytics engine capable of handling large volumes of data in near real-time. Elasticsearch is used for log aggregation and analysis within Hopsworks. - **Jupyter/...
5. **集成其他工具**:Zeppelin可以与诸如Jupyter、Kafka、Elasticsearch等其他工具集成,进一步扩展其功能。例如,可以接收Kafka实时流数据进行分析,或者将结果存储到Elasticsearch进行全文检索。 6. **配置与...
数据展示和对接:Zeppelin 选用考量: HDFS不管是在存储的性能,稳定性 吞吐量 都是在主流文件系统中很占有优势的 如果感觉HDFS存储还是比较慢,可以采用SSD硬盘等方案。存储模块:搭建和配置HDFS分布式存储系统,...
- **资源中心:** 由 HBase、Elasticsearch 和 MySQL 组成,用于用户画像、内容画像和主数据管理。 - **数据仓库:** 利用 Hive、Spark 和 HDFS 进行数据存储。 **产品组件:** - **推荐系统:** 基于资源中心,集成了...
在监控和警报方面,作者介绍了 ELK Stack(Elasticsearch、Logstash、Kibana),能够实时监控 Spark Streaming 任务的执行情况,提供了一个高效的监控解决方案。 在 Kafka 方面,作者介绍了 Kafka 的自助服务 UI,...
Zeppelin ,一个基于Web的笔记本,可进行交互式数据分析。 您可以使用SQL,Scala等制作漂亮的数据驱动,交互式和协作式文档。 核心功能: 基于Web的笔记本样式编辑器。 内置Apache Spark支持 要了解有关齐柏林...
Apache Zeppelin 0.7.2 中文文档.epub Elasticsearch 5.4 中文文档.epub kafka 中文文档 0.10.0.epub Kibana 5.2 中文文档.epub Spark 2.0.2 中文文档.epub Storm 1.1.0 中文文档.epub
MaxCompute2.0的开源计算引擎支持包括但不限于Presto、Kylin、Drill、Spark、ElasticSearch和Flink等。这些开源计算引擎与MaxCompute2.0保持了自研优势的同时,还能够拥抱开源生态,实现数据存储、资源调度和安全...
即Elasticsearch、Logstash、Kibana的组合),数据总线(采用Apache Kafka进行高效的消息传递),数据实时分析(支持Spark Streaming、Storm和Flink等流处理框架),以及数据存储(Elasticsearch as a Service,提供...
包装Gluster , Spark , Kafka , Flink , Nifi和ElasticSearch 以及所有管理控制台,例如Cerebro , Kibana , Zeppelin , Kafka-Manager , Grafana和Prometheus 。 一个旨在彻底简化大数据集群的部署,管理...
此外,批处理框架如MapReduce和Tez,高性能处理框架Spark,以及分布式文件系统HDFS和搜索引擎Elastic Search等,共同构建了大数据处理的基础。同时,大数据分析也涉及到实时数据库、数据挖掘、机器学习算法库和可视...
12. **Logstash**: 数据收集、处理和转发工具,通常与Elasticsearch和Kibana一起构建ELK日志分析栈。 13. **Kibana**: 数据可视化工具,用于探索和展示Elasticsearch中的数据。 14. **Ranger**: 集中式安全管理...
采用先进的技术架构,如分布式数据库、机器学习、大数据技术平台(如Flume、Kafka、HDFS、Hive、Sqoop、Yarn、ZooKeeper、Zeppelin、Storm、Elastic Search、MapReduce、Spark、HBase、Kylin等),实现数据的高效...
数据分析层则利用Zeppelin、Python等工具进行算法构建和模型训练,Tableau则用于数据可视化报告。 智能算法的应用是提升容量管理效能的关键。通过收集系统性能和容量数据、日志信息等,结合机器学习算法,可以识别...
数据分析层包括数据分析平台和算法,如Zeppelin用于算法开发,Tableau用于数据可视化,以辅助运维人员进行决策。 智能算法的应用是容量管理的一大亮点。通过对历史数据的学习和分析,可以预测系统的容量需求,提前...
- **Elasticsearch**:分布式搜索和分析引擎。 - **Druid**:面向现代数据分析的高性能数据库。 - **Zeppelin**:用于交互式分析和展示数据的Web平台。 #### 五、Hadoop MapReduce 示例 以计算文本文件中单词的...