/**
* author: ahuaxuan(张荣华)
* date 2010-2-25
*/
深入浅出cassandra 1 安装
cassandra是什么,套用官方介绍,cassandra是高可扩展性的第二代分布式数据库。背后的理论依据是amazon的dynamo和google的bigtable.
所以要完全的,深入的理解cassandra,那我们就必须深入的理解dynamo和bigtable这两个理论基础。当然在后续的文章中,ahuaxuan会和大家一起来深入并研究这两个理论。
学习一个陌生的技术,最重要的第一步就是先让它给运行起来,这个和ahuaxuan写深入浅出jackrabbit的流程是一样的,运行之后根据sample来分析其数据模型,然后再逐个深入的研究模型背后的实现。
第一步,我们要下载cassandra,下载地址为,目前的版本号为0.5:
http://incubator.apache.org/cassandra/
第二步,解压下载包,找到conf目录
修改两个配置文件,第一个是log4j.properties
将log4j.appender.R.File修改成你自己的目录,比如ahuaxuan是在windows上运行cassandra,所以应该改成
log4j.appender.R.File=d:/var/log/cassandra/system.log
第三步,修改另外一个配置文件storage-conf.xml.
找到下面几个xml节点:
<CommitLogDirectory>d:/var/lib/cassandra/commitlog</CommitLogDirectory>
<DataFileDirectories>
<DataFileDirectory>d:/var/lib/cassandra/data</DataFileDirectory>
</DataFileDirectories>
<CalloutLocation>d:/var/lib/cassandra/callouts</CalloutLocation>
<StagingFileDirectory>d:/var/lib/cassandra/staging</StagingFileDirectory>
并修改成你需要的路径。
第四步配置环境变量
在环境变量配置中加入CD=xxxx/cassandra根目录。
接着就可以启动cassandra了,而在mac os和Linux中,第四部不是必须的。
进入cassandra的bin目录,运行cassandra.bat就可以启动了,接着你就可以看到控制台信息,如下:
Starting Cassandra Server
Listening for transport dt_socket at address: 8888
INFO - Sampling index for d:\var\lib\cassandra\data\system\LocationInfo-1-Data.db
INFO - Replaying d:\var\lib\cassandra\commitlog\CommitLog-1265359449282.log
INFO - Log replay complete
INFO - Saved Token found: 88462923653178449654422500688604756479
INFO - Starting up server gossip
至此单实例的cassandra已经跑起来了,当然目前它还没有跑在集群的环境中,事情总是要一步一步来的。
接下来,做啥子呢,肯定是先跑出第一个例子。然后从这个例子中我们必须要有所斩获才行。
分享到:
相关推荐
综上所述,《Cassandra权威指南(中文)》涵盖了Cassandra的各个方面,不仅深入浅出地介绍了其基础知识和技术细节,还提供了丰富的实战案例和社区资源,对于初学者和专业人士来说都是一本不可或缺的手册。...
通过“深入浅出分布式技术原理 教程 下载 下载1.txt”这个文档,读者可以系统地学习到以上各个知识点,并结合实际案例加深理解。无论是初学者还是有经验的开发人员,都能从中受益,提升在分布式技术领域的专业素养。
"深入浅出分布式技术原理教程"旨在帮助读者理解和掌握分布式系统的基础知识和实践应用。本教程可能涵盖了以下关键知识点: 1. 分布式系统概念:分布式系统是由多台计算机通过网络连接,共同协作完成一个单一的任务...
本教程“深入浅出分布式技术原理”旨在帮助读者理解并掌握这一核心技术,通过学习,您可以深入了解分布式系统的设计、实现以及优化策略。 分布式技术的核心目标在于提高系统的可伸缩性、容错性和性能。它包括多个子...
本资料“187深入浅出分布式技术原理”旨在帮助读者理解分布式系统的精髓,掌握如何设计和实现高效、可靠的分布式系统。 分布式技术的核心理念在于将任务分解到多个独立的节点上,以实现并行处理,提高系统的性能和...
《深入浅出Netty_netty5.0_》是针对Netty 5.0版本的一本详细教程,旨在帮助读者理解并熟练运用这一强大的网络编程框架。Netty是一个开源的Java框架,它为开发高效、稳定、可扩展的网络应用提供了全面的支持。在本文...
本篇将深入浅出地探讨大数据的来源、特性和如何理解和应用。 首先,我们来看大数据的来源。大数据主要来源于以下几个方面: 1. 社交媒体:如微博、微信、Facebook等平台上的用户行为数据,提供了丰富的个人喜好、...
深入浅出 Spark Apache Spark 是一个快速、通用的大数据处理引擎,具有低延迟、交互式使用和高效处理能力。Spark 是 UC Berkeley AMPLab 开发的,作为一种计算框架,分布式资源工作交由集群管理软件(Mesos、YARN...
本教程“深入浅出分布式技术原理”旨在帮助读者理解并掌握分布式系统的基础和核心原理,以便在实际工作中有效应用。 分布式系统的基石在于其能够通过网络将多台计算机连接起来,形成一个整体,对外表现为单一的系统...
NoSQL数据库包括Hbase、Cassandra、MongoDB等,它们支持灵活的数据模型,适合处理大规模非结构化数据。使用NoSQL的原因在于:高扩展性、高可用性和高性能,尤其在处理高并发场景时,能提供更好的性能和成本效益。 ...
根据提供的文档信息,我们可以深入探讨其中提及的大数据技术的关键知识点,包括大数据的发展历史、Hadoop与Spark的基础介绍以及相关的开源技术框架。 ### 大数据技术发展简史 大数据技术的发展经历了多个阶段,从...
这本实验指导手册将深入浅出地介绍以上知识点,并提供实操练习,帮助读者通过理论与实践相结合的方式,提升大数据平台运维的专业技能,为获取“1+X”大数据平台运维职业技能等级证书做好充分准备。
《从零开始学Storm 第2版》是一本深入浅出的Storm学习教程,旨在帮助初学者全面理解并掌握Apache Storm这一分布式实时计算系统。Storm是一个开源的、用于处理大规模流式数据的工具,广泛应用于实时分析、在线机器...
《Hibernate开发指南》是一部经典教程,它深入浅出地介绍了如何使用Hibernate这一强大的Java对象关系映射(ORM)框架。Hibernate作为Java世界中备受推崇的数据持久化解决方案,它极大地简化了数据库操作,使得开发者...
李西宁老师的这门课程,深入浅出地介绍了分布式系统的概念、原理和实践,是学习这一领域的宝贵资源。以下将从分布式系统的基本概念、核心特性、常见模型、主要挑战以及一些关键技术和工具等方面展开详细讨论。 一、...
本书深入浅出地讲解了Spark的内部工作原理,旨在帮助读者理解和掌握Spark在大规模数据处理中的高效性能和灵活性。 Spark作为一款快速、通用且可扩展的数据处理引擎,其核心特性在于DAG(有向无环图)执行模型和内存...
这本书深入浅出地介绍了Hadoop生态系统,为读者提供了全面且深入的理解,是学习和掌握Hadoop不可或缺的资源。 Hadoop是Apache基金会开发的一个开源分布式计算框架,其核心设计理念是处理和存储海量数据。Hadoop的...
本书《大规模分布式存储系统:原理解析与架构实战》由杨传辉编著,旨在深入浅出地讲解分布式存储的基本概念、核心技术和实际应用。 分布式存储系统是一种通过网络连接多台独立计算机,共同构成一个存储池,实现数据...
"精通数据库课件大全"这个资源集合提供了一系列的PPT课件,旨在深入浅出地讲解数据库的基础知识,帮助学习者构建坚实的数据管理理论基础。下面将详细阐述这些知识点。 1. SQL语言:SQL(Structured Query Language...
这本书深入浅出地讲解了如何利用Storm进行实时数据流的处理,为读者揭示了大数据实时计算的核心概念和技术实践。 在大数据时代,实时计算的重要性日益凸显,它能够帮助企业和组织快速响应市场变化,做出及时决策。...