近来在研究分布式,在网上看到Katta,是个很强悍的东西,拿来分享下....
Katta is a scalable, failure tolerant, distributed, indexed, data storage.
Katta serves large, replicated, Lucene indexes as shards to serve high loads and very large data sets.
Makes serving large or high load Lucene indexes easy
Serves very large Lucene indexes as index shards on many servers
Replicate shards on different servers for performance and fault-tolerance
Supports pluggable network topologies
Master fail-over
Fast, lightweight, easy to integrate
Plays well with Hadoop clusters
Apache Version 2 License
总的来说,Katta是用来作为分布式的索引管理的,底层使用了hadoop的子项目Zookeeper,Zookeeper是一个针对大型分布式系统的可靠协调系统,是用来协调分布式系统的。
首先去Katta的官网下载:http://sourceforge.net/project/showfiles.php?group_id=225750
下载下来后解压到本地,我的Linux版本是Centos 5
打开三个窗口,然后都进入解压下来的目录
在第一个窗口:
sh bin/katta startMaster
启动Master
第二个窗口:
sh bin/katta startNode
启动Node
第三个窗口:
sh bin/katta addIndex testIndex src/test/testIndexA org.apache.lucene.analysis.KeywordAnalyzer 2
把Katta自带的索引testIndexA加入到Katta中进行管理
最后,我们可以查找了:
bin/katta search testIndex foo:bar 4
在窗口上会出现查找的结果。
以上操作是在一台机器上的运行的,所以完全没有体现Katta的分布式应用,以后会继续更新。
分享到:
- 2009-04-10 15:27
- 浏览 1782
- 评论(1)
- 论坛回复 / 浏览 (0 / 2621)
- 查看更多
相关推荐
《Katta:分布式搜索引擎解决方案详解》 Katta,作为一个开源的分布式搜索引擎解决方案,为处理海量数据的搜索需求提供了高效、可扩展的平台。在本文中,我们将深入探讨Katta的核心特性、工作原理以及如何在实际...
《Katta:云端的Lucene探索》 在信息化飞速发展的今天,大数据处理与搜索技术已经成为各类企业不可或缺的工具。Katta,一个开源项目,以其独特的设计思路和强大的功能,为云计算环境下的全文检索提供了全新的解决...
【code-katta: 卡塔代码】 `code-katta` 是一个开源项目,专注于异步HBase操作。在深入探讨这个项目之前,我们先来理解HBase和异步编程的基本概念。 **HBase** 是一个分布式、列式存储的NoSQL数据库,基于Google的...
多斯蒂·卡塔(Dosti Katta) 一种社交媒体应用程序,人们可以结识来自世界各地的数百万新朋友,并与他们建立联系以结交新朋友 :men_holding_hands: 网站网址 特征 - Authentication - Profile Viewing - Set ...
Katta 是一个灵感来源于 Hive 和 HBase 运行机制的大数据工具。 索引的导入机制类似 Hive 对表数据的管理; 基于 Index 和 Shard 机制又非常类似于 Hbase 对 Table 和 Region 的管理; 内部 ZooKeeper 的选举机制,...
Constellio旨在简化企业内部的搜索体验。 这些基于Lucene的开源搜索引擎各具特色,分别在不同的方面提供了增强和优化,为开发者提供了更多选择,以满足不同场景下的搜索需求。无论是在性能、易用性、可扩展性还是...
覆盆子用于处理 NGS 大数据的快速并行质量控制工具作者:Mohan AVSK Katta ( 、Aamir W Khan ( )、Dadakhalandar Doddamani ( ) 和 Rajeev K Varshney ( ) 基因组学卓越中心ICRISAT,海得拉巴,印度关于处理数百或数...
HEKA Patchmaster进口商 将 HEKA Patchmaster 文件... 核心功能基于 sigTool ( https://doi.org/10.1016/j.neuron.2015.10.042和https://github.com/irondukepublishing/sigTOOL ) 的 HEKA 导入器,并从 Sammy Katta ( ...
除了 Lucene 和 ES,还有 Solr、HadoopContrib、Katta 等全文检索工具。每种工具都有其特点和优缺,选择合适的工具取决于项目的需求和实际情况。 四、Bulk 一次最大处理多少数据量? Bulk 会把将要处理的数据载入...
21011.1.3 深入HiveQL 21311.1.4 Hive小结 22111.2 其他Hadoop相关的部分 22111.2.1 HBase 22111.2.2 ZooKeeper 22111.2.3 Cascading 22111.2.4 Cloudera 22211.2.5 Katta 22211.2.6 CloudBase 22211.2.7 Aster Data...