`
ahuaxuan
  • 浏览: 640576 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

深入浅出cassandra 1 安装

阅读更多

 

/**
   * author: ahuaxuan(张荣华)
   * date 2010-2-25
   */


深入浅出cassandra 1 安装

cassandra是什么,套用官方介绍,cassandra是高可扩展性的第二代分布式数据库。背后的理论依据是amazon的dynamo和google的bigtable.

 

所以要完全的,深入的理解cassandra,那我们就必须深入的理解dynamo和bigtable这两个理论基础。当然在后续的文章中,ahuaxuan会和大家一起来深入并研究这两个理论。

 

学习一个陌生的技术,最重要的第一步就是先让它给运行起来,这个和ahuaxuan写深入浅出jackrabbit的流程是一样的,运行之后根据sample来分析其数据模型,然后再逐个深入的研究模型背后的实现。

 

第一步,我们要下载cassandra,下载地址为,目前的版本号为0.5:

http://incubator.apache.org/cassandra/

第二步,解压下载包,找到conf目录
修改两个配置文件,第一个是log4j.properties
将log4j.appender.R.File修改成你自己的目录,比如ahuaxuan是在windows上运行cassandra,所以应该改成
log4j.appender.R.File=d:/var/log/cassandra/system.log

 

第三步,修改另外一个配置文件storage-conf.xml.
找到下面几个xml节点:
<CommitLogDirectory>d:/var/lib/cassandra/commitlog</CommitLogDirectory>
  <DataFileDirectories>
      <DataFileDirectory>d:/var/lib/cassandra/data</DataFileDirectory>
  </DataFileDirectories>
  <CalloutLocation>d:/var/lib/cassandra/callouts</CalloutLocation>
  <StagingFileDirectory>d:/var/lib/cassandra/staging</StagingFileDirectory>

 

并修改成你需要的路径。

 

第四步配置环境变量

在环境变量配置中加入CD=xxxx/cassandra根目录。

接着就可以启动cassandra了,而在mac os和Linux中,第四部不是必须的。

 

进入cassandra的bin目录,运行cassandra.bat就可以启动了,接着你就可以看到控制台信息,如下:

 

Starting Cassandra Server
Listening for transport dt_socket at address: 8888
INFO - Sampling index for d:\var\lib\cassandra\data\system\LocationInfo-1-Data.db
INFO - Replaying d:\var\lib\cassandra\commitlog\CommitLog-1265359449282.log
INFO - Log replay complete
INFO - Saved Token found: 88462923653178449654422500688604756479
INFO - Starting up server gossip

 

至此单实例的cassandra已经跑起来了,当然目前它还没有跑在集群的环境中,事情总是要一步一步来的。

 

接下来,做啥子呢,肯定是先跑出第一个例子。然后从这个例子中我们必须要有所斩获才行。









5
0
分享到:
评论
4 楼 咖啡刀 2010-06-22  
咖啡刀 写道
我晕...windows下配置d:/var/lib/cassandra/callouts???

这个有点害人...可能是作者快速写文章笔误啊...大家配置的时候可以定要在windows平台上改成\这个啊
3 楼 咖啡刀 2010-06-21  
我晕...windows下配置d:/var/lib/cassandra/callouts???
2 楼 bavnnsym 2010-03-15  
在环境变量配置中加入CD=xxxx/cassandra根目录。
这行是不是有问题啊????
前面怎么有CD=??
1 楼 zhangcheng 2010-03-05  
我最近也在研究cassandra,跑了几个例子,我先用来做日志系统~

有机会讨论啊

相关推荐

    cassandra权威指南(中文)

    综上所述,《Cassandra权威指南(中文)》涵盖了Cassandra的各个方面,不仅深入浅出地介绍了其基础知识和技术细节,还提供了丰富的实战案例和社区资源,对于初学者和专业人士来说都是一本不可或缺的手册。...

    深入浅出分布式技术原理 教程 下载 下载1.zip

    通过“深入浅出分布式技术原理 教程 下载 下载1.txt”这个文档,读者可以系统地学习到以上各个知识点,并结合实际案例加深理解。无论是初学者还是有经验的开发人员,都能从中受益,提升在分布式技术领域的专业素养。

    深入浅出分布式技术原理 教程 下载 下载3.zip

    "深入浅出分布式技术原理教程"旨在帮助读者理解和掌握分布式系统的基础知识和实践应用。本教程可能涵盖了以下关键知识点: 1. 分布式系统概念:分布式系统是由多台计算机通过网络连接,共同协作完成一个单一的任务...

    深入浅出分布式技术原理 教程 下载 下载4.zip

    本教程“深入浅出分布式技术原理”旨在帮助读者理解并掌握这一核心技术,通过学习,您可以深入了解分布式系统的设计、实现以及优化策略。 分布式技术的核心目标在于提高系统的可伸缩性、容错性和性能。它包括多个子...

    187深入浅出分布式技术原理

    本资料“187深入浅出分布式技术原理”旨在帮助读者理解分布式系统的精髓,掌握如何设计和实现高效、可靠的分布式系统。 分布式技术的核心理念在于将任务分解到多个独立的节点上,以实现并行处理,提高系统的性能和...

    深入浅出Netty_netty5.0_

    《深入浅出Netty_netty5.0_》是针对Netty 5.0版本的一本详细教程,旨在帮助读者理解并熟练运用这一强大的网络编程框架。Netty是一个开源的Java框架,它为开发高效、稳定、可扩展的网络应用提供了全面的支持。在本文...

    大数据:深入浅出.pptx

    本篇将深入浅出地探讨大数据的来源、特性和如何理解和应用。 首先,我们来看大数据的来源。大数据主要来源于以下几个方面: 1. 社交媒体:如微博、微信、Facebook等平台上的用户行为数据,提供了丰富的个人喜好、...

    深入浅出spark.pptx

    深入浅出 Spark Apache Spark 是一个快速、通用的大数据处理引擎,具有低延迟、交互式使用和高效处理能力。Spark 是 UC Berkeley AMPLab 开发的,作为一种计算框架,分布式资源工作交由集群管理软件(Mesos、YARN...

    深入浅出分布式技术原理 教程 下载 下载2.zip

    本教程“深入浅出分布式技术原理”旨在帮助读者理解并掌握分布式系统的基础和核心原理,以便在实际工作中有效应用。 分布式系统的基石在于其能够通过网络将多台计算机连接起来,形成一个整体,对外表现为单一的系统...

    深入浅出解析大数据平台架构.docx

    NoSQL数据库包括Hbase、Cassandra、MongoDB等,它们支持灵活的数据模型,适合处理大规模非结构化数据。使用NoSQL的原因在于:高扩展性、高可用性和高性能,尤其在处理高并发场景时,能提供更好的性能和成本效益。 ...

    大数据技术分享 大数据技术深入浅出 共39页.pdf

    根据提供的文档信息,我们可以深入探讨其中提及的大数据技术的关键知识点,包括大数据的发展历史、Hadoop与Spark的基础介绍以及相关的开源技术框架。 ### 大数据技术发展简史 大数据技术的发展经历了多个阶段,从...

    实验指导手册.rar

    这本实验指导手册将深入浅出地介绍以上知识点,并提供实操练习,帮助读者通过理论与实践相结合的方式,提升大数据平台运维的专业技能,为获取“1+X”大数据平台运维职业技能等级证书做好充分准备。

    从零开始学Storm 第2版

    《从零开始学Storm 第2版》是一本深入浅出的Storm学习教程,旨在帮助初学者全面理解并掌握Apache Storm这一分布式实时计算系统。Storm是一个开源的、用于处理大规模流式数据的工具,广泛应用于实时分析、在线机器...

    Hibernate开发指南

    《Hibernate开发指南》是一部经典教程,它深入浅出地介绍了如何使用Hibernate这一强大的Java对象关系映射(ORM)框架。Hibernate作为Java世界中备受推崇的数据持久化解决方案,它极大地简化了数据库操作,使得开发者...

    分布式系统中文课件

    李西宁老师的这门课程,深入浅出地介绍了分布式系统的概念、原理和实践,是学习这一领域的宝贵资源。以下将从分布式系统的基本概念、核心特性、常见模型、主要挑战以及一些关键技术和工具等方面展开详细讨论。 一、...

    Spark技术内幕 深入解析Spark内核架构设计与实现原理 ,张安站著

    本书深入浅出地讲解了Spark的内部工作原理,旨在帮助读者理解和掌握Spark在大规模数据处理中的高效性能和灵活性。 Spark作为一款快速、通用且可扩展的数据处理引擎,其核心特性在于DAG(有向无环图)执行模型和内存...

    hadoop经典教材

    这本书深入浅出地介绍了Hadoop生态系统,为读者提供了全面且深入的理解,是学习和掌握Hadoop不可或缺的资源。 Hadoop是Apache基金会开发的一个开源分布式计算框架,其核心设计理念是处理和存储海量数据。Hadoop的...

    大规模分布式存储系统:原理解析与架构实战.杨传辉.pdf

    本书《大规模分布式存储系统:原理解析与架构实战》由杨传辉编著,旨在深入浅出地讲解分布式存储的基本概念、核心技术和实际应用。 分布式存储系统是一种通过网络连接多台独立计算机,共同构成一个存储池,实现数据...

    精通 数据库课件大全

    "精通数据库课件大全"这个资源集合提供了一系列的PPT课件,旨在深入浅出地讲解数据库的基础知识,帮助学习者构建坚实的数据管理理论基础。下面将详细阐述这些知识点。 1. SQL语言:SQL(Structured Query Language...

    《Storm实战构建大数据实时计算》PDF

    这本书深入浅出地讲解了如何利用Storm进行实时数据流的处理,为读者揭示了大数据实时计算的核心概念和技术实践。 在大数据时代,实时计算的重要性日益凸显,它能够帮助企业和组织快速响应市场变化,做出及时决策。...

Global site tag (gtag.js) - Google Analytics