`
猫太的鱼
  • 浏览: 239364 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Taobao分布式存储引擎Tair运行失败的常见原因

 
阅读更多
在dataserver上看到的失败日志通常都是,心跳验证失败,例如下面的

[2013-05-13 19:06:17] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:3
[2013-05-13 19:06:18] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:18] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:18] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:3
[2013-05-13 19:06:19] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:19] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:19] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:3
[2013-05-13 19:06:20] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:20] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:20] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:3
[2013-05-13 19:06:21] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:21] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:21] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:3
[2013-05-13 19:06:22] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:22] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:22] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:3
[2013-05-13 19:06:23] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:23] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:2
[2013-05-13 19:06:23] ERROR handlePacket (heartbeat_thread.cpp:138) [1143060800] ControlPacket, cmd:3


所以,往往只从dataserver上的error log来看,很难定位问题所在。 这时候,需要我们分析configserver上的error log来分析运行失败的原因了。

我自己在搭建Tair的时候, 遇到了两种情况, 不过我相信不仅仅只是这2个, 大家如果遇到了同样的问题, 欢迎分享。  例如下面的

[2013-05-13 18:56:46] ERROR load (config.cpp:124) [1165531456] 不能打开配置文件: ../etc/group.conf
[2013-05-13 18:56:46] ERROR load_group_file (server_conf_thread.cpp:125) [1165531456] load config file ../etc/group.conf error


原因是: 在configserver.conf中错误的配置了group_file的路径,例如:
[configserver]
port=5198
log_file=logs/config.log
pid_file=logs/config.pid
log_level=info
group_file=group.conf
data_dir=data/data


此处的group_file=group.conf,应该对应configserver上的group.conf文件的路径。

-----------------------cut-----------------------------

还有另外一种情况是, 在log里面会看到:

[2013-05-13 18:59:23] ERROR rebuild (group_info.cpp:624) [1099381056] can not get enough data servers. need 1 lef 0 
[2013-05-13 19:06:09] ERROR rebuild (group_info.cpp:624) [1106565440] can not get enough data servers. need 1 lef 0 


configserver怎么都找不到dataserver,这里需要注意的是, 在启动服务时,一定要先启动dataserver上的服务,然后再启动configserver上的服务。

还有一种导致这个问题的原因是,在configserver.conf和dataserver.conf这两个配置文件中,网卡的映射需要填写正确。 例如,

#slave config server
config_server=10.210.214.136:5198
dev_name=eth1


如果这里配置的是eth1,然而你的server恰巧没有eth1这个网卡,那么也会导致Tair运行失败。  先写到这里, 再遇到问题,再和大家分享。
分享到:
评论

相关推荐

    tair-2.3分布式key-value存储引擎

    tair 是淘宝自己开发的一个分布式 key/value 存储引擎. tair 分为持久化和非持久化两种使用方式. 非持久化的 tair 可以看成是一个分布式缓存. 持久化的 tair 将数据存放于磁盘中. 为了解决磁盘损坏导致数据丢失, ...

    淘宝分布式 key/value 存储引擎Tair Java客户端测试程序

    具体情况这篇文章的描述:淘宝分布式 key/value 存储引擎Tair安装部署过程及Java客户端测试一例(http://blog.csdn.net/lanxuezaipiao/article/details/37599151) 测试程序运行步骤: make build make run

    分布式 存储系统

    分布式存储引擎是支持分布式存储系统运行的核心组件,它包括公共模块如内存管理、基础数据结构、锁、任务队列、网络框架和压缩与解压缩等。不同组件如RootServer、UpdateServer和ChunkServer分别实现了数据管理、...

    分布式缓存tair介绍

    Tair是一款由淘宝自主研发的分布式键值存储系统,它主要设计用于处理大量的key-value数据,提供高并发访问和高效的数据存储。Tair分为持久化和非持久化两种模式,非持久化模式下,Tair充当分布式缓存,而持久化模式...

    分布式缓存tair的内部结构介绍

    分布式缓存系统Tair是一个专为高性能、高可用性设计的键值存储系统。它支持多种存储引擎,但每个系统实例仅能使用一种。Tair的架构由几个关键组件构成,包括config_server、data_server、storage模块以及一些通用...

    我们是怎么支撑双11万亿流量的—— 阿里分布式缓存(Tair)技术分享_姜志锋@阿里巴巴.pdf

    阿里巴巴集团为了支撑双11万亿流量,开发了大规模分布式缓存 Tair,这项技术挑战了传统的缓存技术,满足了复杂的数据结构存储需求、热点问题、性能提升、成本降低等要求。 Tair 技术分享 Tair 是阿里巴巴集团自研...

    我们是怎么支撑双11万亿流量的—— 阿里分布式缓存(Tair)技术分享_姜志锋@阿里巴巴.zip

    Tair不仅支持常见的键值存储,还支持更丰富的数据结构,如字符串、列表、哈希表等,这使得它在处理各种业务场景时具有很高的灵活性。 在支撑万亿流量的过程中,Tair实现了以下几个核心功能: 1. **高可用性**:...

    com.taobao.tair

    **com.taobao.tair** 是一个由阿里巴巴集团开发的分布式键值存储系统,主要用于处理海量数据的存储和访问。在IT行业中,这类系统通常被称为NoSQL数据库,它们以高并发、低延迟和大规模数据处理能力著称。Tair的设计...

    FastDFS 分布式存储 实战

    FastDFS是一个开源的轻量级分布式文件系统,主要用于解决大数据存储和读写负载均衡的问题。它的设计非常轻便,适合存储4KB到500MB大小的文件,尤其适用于图片网站、短视频网站、文档分享、应用下载等场景。与传统的...

    分布式键值系统-Tair1

    Tair是一款由淘宝研发的分布式键值系统,其设计目标是提供高可用性、高性能的数据存储服务。Tair系统由中心控制节点(config server)和多个服务节点(Data server)构成,旨在解决大规模分布式环境下的数据存储和...

    tair.zip, tair源码

    1. 分布式架构:tair采用分布式存储设计,支持多节点集群,通过一致性哈希算法实现数据的自动分片和负载均衡,确保系统的高可用性和可扩展性。 2. 内存存储:tair的数据存储在内存中,提供亚毫秒级的读写速度,满足...

    tair与redis比较

    在分布式缓存系统中,Tair和Redis是两个常见的选择。下面,我们将对Tair和Redis进行比较,探讨它们的架构、功能、使用场景和性能特点。 Tair架构 Tair是一个分布式的缓存系统,主要包括四个模块:ConfigServer、...

    memcache、redis、tair性能对比测试报告

    《memcache、redis、tair性能对比测试报告》详述了在分布缓存技术领域,对这三种主流缓存服务器的性能评估。测试主要目的是在相同功能特性的基础上,对比它们在不同场景下的表现,因此排除了ehcache(组件级缓存)和...

    分布式key/value存储系统Tair

    Tair是由淘宝网自主开发的Key/Value结构数据存储系统,在淘宝网有着大规模的应用。您在登录淘宝、查看商品详情页面或者在淘江湖和好友“捣浆糊”的时候,都在直接或间接地和Tair交互。Tair是一个Key/Value结构数据的...

    tair 服务端源码包

    Tair,全称为Taobao Advanced In-Memory Storage,是淘宝自主研发的一款高性能、高可用的分布式Key/Value存储系统。它在淘宝内部广泛应用于缓存、配置中心、日志存储等多个场景,极大地提升了业务处理效率。本文将...

    tair3-client-3.0.1.13.jar

    maven 淘宝下的jar包啊

    tair-2.3.tar.tar

    淘宝tair源代码包,tair 是淘宝自己开发的一个分布式 key/value 存储引擎。

    1-2+BitCube:分布式位图计算引擎.pdf

    【1-2+BitCube:分布式位图计算引擎】是一个专为解决大数据实时筛选和高效率计算而设计的自研分布式系统。该系统源于美团,旨在优化业务中的数据处理速度,尤其是在面对海量数据(近10亿条)和复杂筛选条件(400+...

Global site tag (gtag.js) - Google Analytics