katta初体验 - 疯子的遐想 - ITeye博客

`

zkl_1987

浏览: 247519 次
性别:
来自: 杭州

最近访客更多访客>>

haiyupeter

nuannuandetaiyang

ahiwey

gujie890411

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

你的样子越来越美：楼主是来炫耀的。
java图片处理解决方案
di1984HIT：关注一下。
hypertable安装
di1984HIT： katta好久不更新了。
Katta源码分析（1）--显示节点
tracyitbird：谢谢博主，很好说的很明白。不过一般bin的环境变量已经配置好了 ...
解决Hadoop报Name node is in safe mode 错误
凌寒_微雨：总结的很好
android 笔记——listView应用

katta初体验

博客分类：

katta

lucene Hadoop CentOS Linux Apache

阅读更多

近来在研究分布式，在网上看到Katta，是个很强悍的东西，拿来分享下....
Katta is a scalable, failure tolerant, distributed, indexed, data storage.
Katta serves large, replicated, Lucene indexes as shards to serve high loads and very large data sets.

Makes serving large or high load Lucene indexes easy
Serves very large Lucene indexes as index shards on many servers
Replicate shards on different servers for performance and fault-tolerance
Supports pluggable network topologies
Master fail-over
Fast, lightweight, easy to integrate
Plays well with Hadoop clusters
Apache Version 2 License

总的来说，Katta是用来作为分布式的索引管理的，底层使用了hadoop的子项目Zookeeper，Zookeeper是一个针对大型分布式系统的可靠协调系统，是用来协调分布式系统的。

首先去Katta的官网下载：http://sourceforge.net/project/showfiles.php?group_id=225750

下载下来后解压到本地，我的Linux版本是Centos 5
打开三个窗口，然后都进入解压下来的目录
在第一个窗口：
sh bin/katta startMaster
启动Master
第二个窗口：
sh bin/katta startNode
启动Node
第三个窗口：
sh bin/katta addIndex testIndex src/test/testIndexA org.apache.lucene.analysis.KeywordAnalyzer 2
把Katta自带的索引testIndexA加入到Katta中进行管理

最后，我们可以查找了：
bin/katta search testIndex foo:bar 4

在窗口上会出现查找的结果。

以上操作是在一台机器上的运行的，所以完全没有体现Katta的分布式应用，以后会继续更新。

分享到：

katta的分布式 | ZooKeeper（转载）

2009-04-10 15:27
浏览 1801
评论(1)
论坛回复 / 浏览 (0 / 2627)
查看更多

评论

1 楼 di1984HIT 2013-02-14

Katta的shard是有一定命名规律的。

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

katta-master.zip: 《Katta：分布式搜索引擎解决方案详解》 Katta，作为一个开源的分布式搜索引擎解决方案，为处理海量数据的搜索需求提供了高效、可扩展的平台。在本文中，我们将深入探讨Katta的核心特性、工作原理以及如何在实际...

katta-开源: 《Katta：云端的Lucene探索》在信息化飞速发展的今天，大数据处理与搜索技术已经成为各类企业不可或缺的工具。Katta，一个开源项目，以其独特的设计思路和强大的功能，为云计算环境下的全文检索提供了全新的解决...

code-katta:卡塔代码: 【code-katta: 卡塔代码】 `code-katta` 是一个开源项目，专注于异步HBase操作。在深入探讨这个项目之前，我们先来理解HBase和异步编程的基本概念。 **HBase** 是一个分布式、列式存储的NoSQL数据库，基于Google的...

Dosti-Katta:一种社交媒体应用程序，人们可以在这里结识来自世界各地的数百万新朋友，并与他们建立联系以结交新朋友。人们查看其他人的个人资料并关注他们，以通过他们的帖子获得最新动态，并通过喜欢，评论和获得很多乐趣来表达自己的想法: 多斯蒂·卡塔（Dosti Katta）一种社交媒体应用程序，人们可以结识来自世界各地的数百万新朋友，并与他们建立联系以结交新朋友 :men_holding_hands: 网站网址特征 - Authentication - Profile Viewing - Set ...

基于Java的千亿级分布式搜索解决方案设计源码: 该解决方案的架构设计可能是基于微服务理念，每个服务模块如katta-hadoop、katta-server、katta-core等，都分工明确，各自承担着数据处理、服务提供、核心算法等不同任务。这种模块化的设计思路有利于系统的维护和...

人工智能-项目实践-搜索引擎-高可用的分布式搜索引擎: Katta 是一个灵感来源于 Hive 和 HBase 运行机制的大数据工具。索引的导入机制类似 Hive 对表数据的管理；基于 Index 和 Shard 机制又非常类似于 Hbase 对 Table 和 Region 的管理；内部 ZooKeeper 的选举机制，...

8个基于Lucene的开源搜索引擎(推荐): Constellio旨在简化企业内部的搜索体验。这些基于Lucene的开源搜索引擎各具特色，分别在不同的方面提供了增强和优化，为开发者提供了更多选择，以满足不同场景下的搜索需求。无论是在性能、易用性、可扩展性还是...

Raspberry:Raspberry，一种用于处理原始 FASTQ 文件的并行化 QC 工具: 覆盆子用于处理 NGS 大数据的快速并行质量控制工具作者：Mohan AVSK Katta ( 、Aamir W Khan ( )、Dadakhalandar Doddamani ( ) 和 Rajeev K Varshney ( ) 基因组学卓越中心ICRISAT，海得拉巴，印度关于处理数百或数...

HEKA Patchmaster Importer：用于导入 HEKA Patchmaster 文件的 Matlab 类-matlab开发: HEKA Patchmaster进口商将 HEKA Patchmaster 文件... 核心功能基于 sigTool ( https://doi.org/10.1016/j.neuron.2015.10.042和https://github.com/irondukepublishing/sigTOOL ) 的 HEKA 导入器，并从 Sammy Katta ( ...

精选7道Elastic Search面试题！.pdf: 除了 Lucene 和 ES，还有 Solr、HadoopContrib、Katta 等全文检索工具。每种工具都有其特点和优缺，选择合适的工具取决于项目的需求和实际情况。四、Bulk 一次最大处理多少数据量？ Bulk 会把将要处理的数据载入...

Global site tag (gtag.js) - Google Analytics