scribe 介绍:
scribe 是facebook 开源的分布式日志系统 。 可以用java 借助log4j 向分布式scribe 写入日志。
安装环境: centos5.2
所需软件:
安装过程:
一、输入gcc –v 检查gcc版本是否>3.3.5
是,则继续下一步。否,则安装gcc 。
二、安装ruby 和python
python 用默认安装路径。Ruby 推荐使用默认路径
安装过程均为./configure make make install
三、安装lievent
解压安装即可
安装过程为./configure make make install
四、安装 boost
解压安装即可(不可改路径)
http://hi.baidu.com/maydaygmail/blog/item/9e38993bf4a176dc7c1e716c.html
五、安装 php 和libxml2
先安装libxml2 (php依赖它) 在安装php(默认安装路径)
安装过程均为./configure make make install
六、安装facebook 服务-- thrift 和 fb303
首先解压并进入thrift 目录
./bootstrap.sh
./configure –with-boost=/usr/local/include/boost/ -- with-php-config=/phppath /bin/php-config
make
make install
thrift 安装完毕。
在当前目录 cd 到contrib/fb303/ :
./bootstrap.sh
./configure –with-boost=/usr/local/include/boost/
make
make install
fb303安装完毕。
七、安装scribe
./bootstrap
./configure –with-boost=/usr/local/include/boost/
make
make install
安装完毕。
配置环境变量 :
BOOST_ROOT=/usr/local/include/boost/
LD_LIBRARY_PATH=/usr/local/include/boost/lib::/usr/lob:/usr/local/lib
测试:
/usr/local/bin/scribed [scribe 解压目录]/examples/example1.conf
回车会出现:
[Sun Oct 31 23:37:38 2010] "STATUS: STARTING"
[Sun Oct 31 23:37:38 2010] "STATUS: configuring"
[Sun Oct 31 23:37:38 2010] "got configuration data from file </home/setups/scribe/scribe/examples/example1.conf>"
[Sun Oct 31 23:37:38 2010] "CATEGORY : default"
[Sun Oct 31 23:37:38 2010] "Creating default store"
[Sun Oct 31 23:37:38 2010] "configured <1> stores"
[Sun Oct 31 23:37:38 2010] "STATUS: "
[Sun Oct 31 23:37:38 2010] "STATUS: ALIVE"
[Sun Oct 31 23:37:38 2010] "Starting scribe server on port 1463"
Thrift: Sun Oct 31 23:37:38 2010 libevent 2.0.7-rc method epoll
okay scribe 服务已启动。 (这个不只是测试,也是启动scribe 服务的方式。)
补充:
关于scribe 的安装 在下载目录下有个有个readme 写的很详细(可能没我写的实用^^)
scribe的启动和集群测试,均在examples 目录下的redme 上 写得相当详细。
如果大家在集群上有疑问,可交流^^
分享到:
相关推荐
- **环境准备**:文中提到了具体的软件版本和安装步骤,例如 CentOS 6.3、Hadoop 2.0.2-alpha、Hive 0.9.0 等。这些版本的选择取决于实际需求和兼容性考虑。 - **节点分配**:根据文中提供的信息,整个系统包括一个...
【scribe-apache-1.5.0.zip】是一款基于Apache许可的开源项目,主要用于日志收集和管理系统。Scribe最初由Facebook开发并贡献给了开源社区,它设计的目的是在一个高流量、分布式环境中集中处理和存储来自不同服务的...
然后,编译和安装scribe: ```bash ./configure make sudo make install ``` #### 3. 配置scribe 在`conf/scribe.conf`中配置scribe,设置监听端口、日志类别和目标服务器等信息。例如: ```conf port = 1463 ...
- **文档**: 可能包含README文件或wiki页面,介绍如何安装、配置和使用scribe。 在实际应用中,scribe常与其它日志处理工具结合使用,例如Logstash或Fluentd,以实现更复杂的数据处理和分析。同时,它也可以配合...
7. **集群监控与日志管理**:了解如何配置和使用Hadoop自带的监控工具,如Nagios、Ganglia,以及日志聚合工具Flume和Scribe,以便于监控集群状态和调试问题。 8. **故障排查**:提供常见问题及解决方案,帮助用户...
Scribe适合简单日志收集和存储,Chukwa适用于Hadoop环境,Kafka强调高吞吐和持久化,而Flume则提供了更灵活的数据流管理。在实际应用中,可以根据业务场景、性能要求和可扩展性需求来选择最适合的系统。
scribe客户端是用于集成日志记录系统的一个开源库,主要针对分布式环境中的日志管理。它支持多种日志接收协议,并且可以轻松地将日志数据发送到各种后端存储,如Hadoop、Cassandra或者Elasticsearch等。在这个压缩包...
总结来说,Scribe适合需要高度容错和简单日志收集的场景;Chukwa适合已建立Hadoop环境,需要进行大规模日志分析的组织;Kafka则适用于实时或近实时数据流处理的需求;而Flume则以其灵活性和可靠性成为日志聚合的优秀...
Facebook Scribe 是一个专门为大规模日志管理设计的系统,它简化了日志收集的过程,提高了日志处理的效率。在需要处理大量日志数据的环境中,Scribe提供了可靠、可扩展的解决方案,为运维人员提供了有力的工具。同时...
1. **日志聚合**:在分布式环境中,各个节点产生的日志数据可以被Scribe集中收集,简化了日志管理和分析的复杂度。 2. **实时流处理**:Scribe可用于实时数据流处理,将数据实时推送到下游分析系统,例如Storm或...
2. 数据存储:海量日志需要大规模的数据存储解决方案,如Hadoop HDFS,提供高容错性和可扩展性。 3. 数据预处理:通过Elasticsearch或Logstash等工具进行数据清洗和格式化,为后续分析做好准备。 4. 数据分析:采用...
- **Scribe:**日志收集系统。 - **Cassandra:**分布式NoSQL数据库系统。 - **Hypertable:**基于HDFS的键值存储系统。 - **Voldemort:**高性能键值存储系统。 - **Azkaban:**批处理作业流程管理系统。 - **Sqoop...
本文将重点介绍几种流行的开源日志系统,包括Facebook的Scribe、Apache的Chukwa以及LinkedIn的Kafka和Cloudera的Flume,探讨它们的设计理念、架构特性以及在海量日志处理方面的优势。 1. Facebook的Scribe Scribe...
再者,论文可能会讨论Facebook的云服务架构,如其内部的开源项目如Thrift和Scribe,这些工具用于跨不同服务进行数据传输和日志聚合,确保系统的可扩展性和灵活性。Facebook也可能使用容器化技术(如Docker)和编排...
Hadoop不仅仅局限于单一的计算模式,随着大数据需求的多样化,出现了如Scribe和Flume这样的日志收集系统,以及Impala这样的实时查询引擎。这些工具进一步扩展了Hadoop在大数据领域的应用范围。 总的来说,Hadoop是...
综上所述,云计算和大数据技术在智能交通系统中的应用,能够帮助城市交通管理部门有效地处理和分析海量交通数据,实现交通管理的智能化、实时化,为解决城市交通问题提供了新的技术途径。通过这些先进技术的应用,...
Chukwa是Apache基金会的一个项目,主要用于大型Hadoop集群的日志管理和分析。它结合了Hadoop的组件,如HDFS和MapReduce,以处理和分析大量日志数据: - Adaptor:作为数据源接口,可以适应不同的输入源,例如...
【推荐】开源日志系统-word范文模板 ...而Scribe的简单架构和强大的容错机制,则使它成为分布式系统日志管理的可靠选择。在实际应用中,企业可以根据自身的需求和现有基础设施,灵活选择或组合使用这些开源工具。