katta的分布式

zkl_1987

浏览: 247847 次
性别:
来自: 杭州

最近访客更多访客>>

haiyupeter

nuannuandetaiyang

ahiwey

gujie890411

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

katta

Hadoop CentOS zk 配置管理项目管理

现在来进行Katta的分布式运行配置，Katta是用来进行分布式索引管理的项目，可以出来大数据量的插入和查询。

我使用的三台机器分别为master，node1，node2，系统都为Centos 5

在下载回来的文件解压后进入conf文件夹，在里面需要改几个文件

masters文件
把localhost改成master（主节点名）

nodes文件
node1
node2（加入你的节点机器的名称）

katta.zk.propeties文件
# comma serperated list of host:port that should run a zookeeper server, # make sure you use hostnames and not ip addresses
zookeeper.servers=<master>:2181 （把localhost改成master）
...

katta-env.sh文件
# Set Katta-specific environment variables here.
...
# The java implementation to use. Required.
export JAVA_HOME=/usr/lib/j2sdk1.5-sun （JDK目录）
...
# host:path where hadoop code should be rsync'd from. Unset by default.
export KATTA_MASTER=server0:/home/$USER/katta-distribution
...

在三台机器上做同样的部署

启动：bin/start-all.sh
关闭：bin/stop-all.sh

接下来部署索引，让Katta来管理索引
部署索引的格式
bin/katta addIndex <name of index> [file:///<path to index>|hdfs://<server name>/<path to index>] <lucene analyzer class name> <replication level>

如果你有装hadoop集群的话，可以把在hadoop上的索引部署到Katta上，让Katta来管理

查找的格式
bin/katta search <index name>[,<index name>,...] “<query>” [count]

然后当然是列出你要查找的数据咯

分享到：

Nutch的配置使用 | katta初体验

2009-04-10 15:45
浏览 2331
评论(2)
论坛回复 / 浏览 (1 / 3372)
分类:企业架构
查看更多

2 楼 lookqlp 2012-05-21

您好。bin/katta addIndex <name of index> [file:///<path to index>|hdfs://<server name>/<path to index>] <lucene analyzer class name> <replication level>
目前版本不是这样使用了没有指定analyzer参数。
我有些不明白 hfds path to index是什么样类型数据。请指教

1 楼 swingboat 2009-07-02

如果master fail-over，你怎么处理呢？

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论