`
houzhaowei
  • 浏览: 497897 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

云计算实战 (海量日志管理)hadoop + scribe -- scribe 介绍和安装

阅读更多

scribe 介绍:

 

scribe 是facebook 开源的分布式日志系统 。 可以用java 借助log4j 向分布式scribe 写入日志。

 

安装环境: centos5.2

 

所需软件:

 

 

安装过程:

一、输入gcc –v 检查gcc版本是否>3.3.5

       是,则继续下一步。否,则安装gcc

二、安装ruby python 

python 用默认安装路径。Ruby 推荐使用默认路径

    安装过程均为./configure  make  make install

三、安装lievent  

解压安装即可

       安装过程为./configure  make  make install

四、安装 boost    

解压安装即可(不可改路径)

       http://hi.baidu.com/maydaygmail/blog/item/9e38993bf4a176dc7c1e716c.html

五、安装 php libxml2 

先安装libxml2 php依赖它) 在安装php(默认安装路径)

       安装过程均为./configure  make  make install

六、安装facebook 服务-- thrift fb303

       首先解压并进入thrift 目录      

./bootstrap.sh

./configure –with-boost=/usr/local/include/boost/ -- with-php-config=/phppath /bin/php-config

make

make install    

thrift 安装完毕。

在当前目录 cd contrib/fb303/

./bootstrap.sh

./configure –with-boost=/usr/local/include/boost/

make

make install

fb303安装完毕。

七、安装scribe

       ./bootstrap

./configure –with-boost=/usr/local/include/boost/

make

make install

 

安装完毕。

 

配置环境变量 :

BOOST_ROOT=/usr/local/include/boost/

LD_LIBRARY_PATH=/usr/local/include/boost/lib::/usr/lob:/usr/local/lib

测试:

        /usr/local/bin/scribed  [scribe 解压目录]/examples/example1.conf 


    
回车会出现:

     [Sun Oct 31 23:37:38 2010] "STATUS: STARTING"

[Sun Oct 31 23:37:38 2010] "STATUS: configuring" 
[Sun Oct 31 23:37:38 2010] "got configuration data from file </home/setups/scribe/scribe/examples/example1.conf>" 
[Sun Oct 31 23:37:38 2010] "CATEGORY : default" 
[Sun Oct 31 23:37:38 2010] "Creating default store" 
[Sun Oct 31 23:37:38 2010] "configured <1> stores" 
[Sun Oct 31 23:37:38 2010] "STATUS: " 
[Sun Oct 31 23:37:38 2010] "STATUS: ALIVE" 
[Sun Oct 31 23:37:38 2010] "Starting scribe server on port 1463" 
Thrift: Sun Oct 31 23:37:38 2010 libevent 2.0.7-rc method epoll

 

okay  scribe 服务已启动。 (这个不只是测试,也是启动scribe 服务的方式。)

 补充:

  关于scribe 的安装 在下载目录下有个有个readme 写的很详细(可能没我写的实用^^)

  scribe的启动和集群测试,均在examples 目录下的redme 上 写得相当详细。

  如果大家在集群上有疑问,可交流^^

分享到:
评论
13 楼 houzhaowei 2012-03-12  
star22 写道
楼主是全部部件都装在一台机器上吗?

对 ,就是一个scribe的server机器
12 楼 star22 2012-03-08  
楼主是全部部件都装在一台机器上吗?
11 楼 nwf5d 2011-02-11  
Scribe、Chukwa和Flume的应用场景是大量日志服务器,收集日志到集群上吧。其中Chukwa更适合收集集群运行信息以利于管理配置。不知道您的应用场景是否需要这个呢?考虑过Chukwa和Flume吗?现在使用Scribe是否稳定?希望能和您多交流,MSN:nwfengwolf@hotmail.com QQ:77878449
10 楼 houzhaowei 2011-01-14  
ciyuanlong 写道
scribe输出给hdfs,是实时put的还是?

用rsync 同步到hadoop 的master 再执行cron 定时导入到hdfs。
9 楼 ciyuanlong 2011-01-14  
scribe输出给hdfs,是实时put的还是?
8 楼 houzhaowei 2010-11-01  
7 楼 houzhaowei 2010-11-01  
cw550284 写道
希望楼主能坚持写下去!!

会的,我在做集群和配置时遇到各种麻烦,国内没有blog 能帮我解决,都是读的英文文档。所以我希望能写的尽善尽美,能帮国内朋友解决些问题。大家有问题可一起交流解决。
scribe + log4j 、 scribe 把日志写入 hadoop  、 以及hadoop 的实际应用  都会相继写入博客。
6 楼 houzhaowei 2010-11-01  
cx6445 写道
scribe,国内知道的人不多,参加过hadoop沙龙吧?

没有,我近期才涉及云计算,分布式scribe 和 hadoop 都是我一个人在搞。以后希望和大家多交流。
5 楼 caibinbupt 2010-11-01  
Scribe的意义在于做HDFS的前端,Flume也可以干类似的事情
mongodb应该不合适使用Scribe的场景,设计的目标不一样
Scribe现在的开发不是很活跃,听说后续有新版本要发布
Scribe是一些后续系统的基础,如FB的实时搜索
4 楼 ray_linn 2010-11-01  
ms和云计算没啥关系,顶多算个分布式而已,贼种东东也不需要啥scribe,用mongodb或者jackrabbit照样可以实现。
3 楼 cx6445 2010-11-01  
scribe,国内知道的人不多,参加过hadoop沙龙吧?
2 楼 cw550284 2010-10-31  
希望楼主能坚持写下去!!
1 楼 tsxm 2010-10-30  
ruby,python,java...

相关推荐

    scribe+hadoop+log4j+hive+mysql

    - **环境准备**:文中提到了具体的软件版本和安装步骤,例如 CentOS 6.3、Hadoop 2.0.2-alpha、Hive 0.9.0 等。这些版本的选择取决于实际需求和兼容性考虑。 - **节点分配**:根据文中提供的信息,整个系统包括一个...

    scribe-apache-1.5.0.zip

    【scribe-apache-1.5.0.zip】是一款基于Apache许可的开源项目,主要用于日志收集和管理系统。Scribe最初由Facebook开发并贡献给了开源社区,它设计的目的是在一个高流量、分布式环境中集中处理和存储来自不同服务的...

    scribe详细安装文档

    然后,编译和安装scribe: ```bash ./configure make sudo make install ``` #### 3. 配置scribe 在`conf/scribe.conf`中配置scribe,设置监听端口、日志类别和目标服务器等信息。例如: ```conf port = 1463 ...

    scribe软件

    - **文档**: 可能包含README文件或wiki页面,介绍如何安装、配置和使用scribe。 在实际应用中,scribe常与其它日志处理工具结合使用,例如Logstash或Fluentd,以实现更复杂的数据处理和分析。同时,它也可以配合...

    Hadoop 0.20.1 配置手册-高清pdf文字版

    7. **集群监控与日志管理**:了解如何配置和使用Hadoop自带的监控工具,如Nagios、Ganglia,以及日志聚合工具Flume和Scribe,以便于监控集群状态和调试问题。 8. **故障排查**:提供常见问题及解决方案,帮助用户...

    开源日志系统比较:scribe、chukwa、kafka、flume.docx

    Scribe适合简单日志收集和存储,Chukwa适用于Hadoop环境,Kafka强调高吞吐和持久化,而Flume则提供了更灵活的数据流管理。在实际应用中,可以根据业务场景、性能要求和可扩展性需求来选择最适合的系统。

    scribe客户端所需jar包

    scribe客户端是用于集成日志记录系统的一个开源库,主要针对分布式环境中的日志管理。它支持多种日志接收协议,并且可以轻松地将日志数据发送到各种后端存储,如Hadoop、Cassandra或者Elasticsearch等。在这个压缩包...

    开源日志系统比较:scribe、chukwa、kafka、flume.pdf

    总结来说,Scribe适合需要高度容错和简单日志收集的场景;Chukwa适合已建立Hadoop环境,需要进行大规模日志分析的组织;Kafka则适用于实时或近实时数据流处理的需求;而Flume则以其灵活性和可靠性成为日志聚合的优秀...

    facebook scribe

    Facebook Scribe 是一个专门为大规模日志管理设计的系统,它简化了日志收集的过程,提高了日志处理的效率。在需要处理大量日志数据的环境中,Scribe提供了可靠、可扩展的解决方案,为运维人员提供了有力的工具。同时...

    Facebook大量数据处理 Scribe.zip

    1. **日志聚合**:在分布式环境中,各个节点产生的日志数据可以被Scribe集中收集,简化了日志管理和分析的复杂度。 2. **实时流处理**:Scribe可用于实时数据流处理,将数据实时推送到下游分析系统,例如Storm或...

    20th.陈晓明-百度海量日志分析架构及处理经验分享-超清文字版.pdf

    2. 数据存储:海量日志需要大规模的数据存储解决方案,如Hadoop HDFS,提供高容错性和可扩展性。 3. 数据预处理:通过Elasticsearch或Logstash等工具进行数据清洗和格式化,为后续分析做好准备。 4. 数据分析:采用...

    Hadoop在雅虎的应用

    - **Scribe:**日志收集系统。 - **Cassandra:**分布式NoSQL数据库系统。 - **Hypertable:**基于HDFS的键值存储系统。 - **Voldemort:**高性能键值存储系统。 - **Azkaban:**批处理作业流程管理系统。 - **Sqoop...

    【推荐】开源日志系统-word范文模板 (17页).pdf

    本文将重点介绍几种流行的开源日志系统,包括Facebook的Scribe、Apache的Chukwa以及LinkedIn的Kafka和Cloudera的Flume,探讨它们的设计理念、架构特性以及在海量日志处理方面的优势。 1. Facebook的Scribe Scribe...

    云计算英文论文 Facebook

    再者,论文可能会讨论Facebook的云服务架构,如其内部的开源项目如Thrift和Scribe,这些工具用于跨不同服务进行数据传输和日志聚合,确保系统的可扩展性和灵活性。Facebook也可能使用容器化技术(如Docker)和编排...

    Hadoop.pdf

    Hadoop不仅仅局限于单一的计算模式,随着大数据需求的多样化,出现了如Scribe和Flume这样的日志收集系统,以及Impala这样的实时查询引擎。这些工具进一步扩展了Hadoop在大数据领域的应用范围。 总的来说,Hadoop是...

    云计算及大数据技术在智能交通中的应用.pdf

    综上所述,云计算和大数据技术在智能交通系统中的应用,能够帮助城市交通管理部门有效地处理和分析海量交通数据,实现交通管理的智能化、实时化,为解决城市交通问题提供了新的技术途径。通过这些先进技术的应用,...

    开源日志系统比较.pdf

    Chukwa是Apache基金会的一个项目,主要用于大型Hadoop集群的日志管理和分析。它结合了Hadoop的组件,如HDFS和MapReduce,以处理和分析大量日志数据: - Adaptor:作为数据源接口,可以适应不同的输入源,例如...

    【推荐】开源日志系统-word范文模板 (17页).docx

    【推荐】开源日志系统-word范文模板 ...而Scribe的简单架构和强大的容错机制,则使它成为分布式系统日志管理的可靠选择。在实际应用中,企业可以根据自身的需求和现有基础设施,灵活选择或组合使用这些开源工具。

Global site tag (gtag.js) - Google Analytics