周海汉
/文
http://blog.csdn.net/ablo_zhou
ablozhou # gmail.com
2010.3.17
cassandra是所谓高可用性第二代分布式数据库。facebook 2008年提交到apache的开源混合非关系数据库。具有amaza 专有分布式key-value数据库dynamo和google bigtable基于列族的数据模型的特点。对于云集算,sns等需求超大数据库,而又随时可能需要更改列等需求,cassandra很适合。我的理解,有了cassandra,就不必费心做数据库集群了,cassandra原生支持分布式节点,一个节点失败了会有其他节点替代。
这么强大的数据库,难怪一推出就受到很大的重视,最近又传出消息,继twitter之后,digg也弃mysql转向了cassandra。
1.直接下载二进制,ubuntu不能运行
到apache官网下载http://cassandra.apache.org/
目前最新版本0.6beta2.
二进制 http://www.apache.org/dyn/closer.cgi?path=/incubator/cassandra/0.6.0/apache-cassandra-0.6.0-beta2-bin.tar.gz
源码:http://www.apache.org/dyn/closer.cgi?path=/incubator/cassandra/0.6.0/apache-cassandra-0.6.0-beta2-src.tar.gz
但我在ubuntu中直接下载二进制执行cassandra出错。
当然,此前必须根据conf/storage-conf.xml和log4j.properties建立相关目录。
zhouhh@zhh64:~$ sudo mkdir /var/lib/cassandra/
zhouhh@zhh64:~$ sudo mkdir /var/lib/cassandra/{commitlog,data,callout,staging}
执行出错:
zhouhh@zhh64:~/cassandra/apache-cassandra-0.6.0-beta2/bin$ ./cassandra -f
./cassandra: 162: -ea: not found
通过apt-cache 搜索不到,因为没有相关源。
zhouhh@zhh64:~$ sudo apt-cache search cassandra
无返回
2.通过apt-get下载
设置源:
root@zhh64:~#sodo vi /etc/apt/sources.list
添加apache官方deb源:
deb http://www.apache.org/dist/cassandra/debian unstable main
deb-src http://www.apache.org/dist/cassandra/debian unstable main
保存,更新
zhouhh@zhh64:~$ sudo apt-get update
此时会提示错误:
W: GPG签名验证错误: http://www.apache.org unstable Release: 由于没有公钥,下列签名无法进行验证: NO_PUBKEY F758CE318D77295D
GPG error: http://www.apache.org unstable Release: The following signatures couldn't be verified because the public key is not available: NO_PUBKEY F758CE318D77295D
没关系,设置public keyserver,增加PUBLIC_KEY:
zhouhh@zhh64:~$ gpg --keyserver wwwkeys.eu.pgp.net --recv-keys F758CE318D77295D
gpg: 下载密钥‘8D77295D’,从 hkp 服务器 wwwkeys.eu.pgp.net
gpg: 密钥 8D77295D:公钥“Eric Evans <eevans@sym-link.com>”已导入
gpg: 没有找到任何绝对信任的密钥
gpg: 合计被处理的数量:1
gpg: 已导入:1 (RSA: 1)
zhouhh@zhh64:~$ gpg --export --armor F758CE318D77295D | sudo apt-key add -
OK
zhouhh@zhh64:~$ sudo apt-get update
不再报错。
3.安装
zhouhh@zhh64:~$ apt-cache search cassandra
cassandra - distributed storage system for structured data
zhouhh@zhh64:~$ sudo apt-get install cassandra
正在读取软件包列表... 完成
正在分析软件包的依赖关系树
正在读取状态信息... 完成
将会安装下列额外的软件包:
ca-certificates-java icedtea-6-jre-cacao java-common jsvc
libcommons-daemon-java libjline-java openjdk-6-jre-headless
openjdk-6-jre-lib rhino tzdata-java
建议安装的软件包:
equivs java-virtual-machine libjline-java-doc sun-java6-fonts
ttf-kochi-gothic ttf-sazanami-gothic ttf-kochi-mincho ttf-sazanami-mincho
ttf-telugu-fonts ttf-oriya-fonts ttf-kannada-fonts ttf-bengali-fonts
rhino-doc
下列【新】软件包将被安装:
ca-certificates-java cassandra icedtea-6-jre-cacao java-common jsvc
libcommons-daemon-java libjline-java openjdk-6-jre-headless
openjdk-6-jre-lib rhino tzdata-java
共升级了 0 个软件包,新安装了 11 个软件包,要卸载 0 个软件包,有 7 个软件未被升级。
需要下载 36.0MB 的软件包。
解压缩后会消耗掉 94.4MB 的额外空间。
您希望继续执行吗?[Y/n]
执行完即安装成功。
再去执行原来的二进制包,提示变了:
zhouhh@zhh64:~/cassandra/apache-cassandra-0.6.0-beta2/bin$ ./cassandra -f
错误: 代理抛出异常 : java.rmi.server.ExportException: Port already in use: 8080; nested exception is:
java.net.BindException: Address already in use
说明,新安装的cassandra已经起作用了。
用ps -ef 可以看到java 的jsvc启动的cassandra进程。
4.参考
http://wiki.apache.org/cassandra/DebianPackaging
http://wiki.woodpecker.org.cn/moin/ApacheCassandra
http://wiki.apache.org/cassandra/GettingStarted
分享到:
相关推荐
Cassandra 是一种分布式数据库系统,特别设计用于处理大规模数据,具备高可用性和可扩展性。在深入了解 Cassandra 之前,理解其配置文件 `storage-config.xml` 中的参数至关重要,因为这些参数直接影响到系统的性能...
分布式存储一般具备数据冗余、一致性、分区容错性等特点,常见的分布式存储系统包括HDFS、Cassandra、MongoDB等。 容器技术是现代分布式系统中不可或缺的一部分,它能够为应用程序提供轻量级、高效的运行环境。容器...
Apache Cassandra 是一个高度可扩展的、高性能的分布式数据库系统,由Facebook开发并在2008年贡献给了Apache软件基金会。Cassandra的设计目标是处理大规模的数据分布,并提供高可用性和一致性的服务,尤其适合互联网...
分布式数据库是现代信息技术领域中的重要概念,尤其在大数据处理、云计算和互联网应用中扮演着核心角色。清华大学作为中国顶级的高等教育机构,在计算机科学和技术的教学方面有着深厚的底蕴。这份"清华大学分布式...
分布式数据库是现代信息技术领域中的一个重要概念,尤其在大数据处理、云计算和互联网服务中扮演着核心角色。本课程是由东北大学的申德荣教授为研究生开设的一门必修课程,旨在深入探讨分布式数据库的设计原理、实现...
3. 云计算服务:Amazon的DynamoDB和Google的Spanner是云服务提供商提供的分布式数据库解决方案,为全球范围内的客户提供高性能、高可用的服务。 5. 物联网(IoT):随着物联网设备的激增,分布式数据库成为处理和...
分布式数据库系统是由多个物理上分散的、但逻辑上统一的数据库组成的系统。这种系统允许数据在多个节点间分布,提供了更高的可用性、容错性和可扩展性。在本版中,作者可能涵盖了以下几个核心知识点: 1. **分布式...
分布式数据库技术是现代信息技术领域中的重要组成部分,尤其在大数据、云计算和互联网应用的推动下,其发展速度迅猛。本报告将深入探讨分布式数据库的核心技术及其发展趋势,为IT专业人士提供宝贵的见解。 分布式...
分布式数据库是一种将数据分散存储在多个物理节点上的数据库系统,旨在提供高可用性、可扩展性和性能优化。这种架构能够处理大规模数据,并且在单个服务器无法满足需求时显得尤为重要。下面,我们将深入探讨分布式...
分布式数据库是一种特殊的数据库系统,它将数据分布在不同的物理位置上,通过网络进行连接和通信,以实现数据的共享和处理。这种设计模式旨在提高系统的可扩展性、容错性和性能,适应大规模数据处理的需求。本资料...
- 产品与方案比较:常见分布式数据库产品的功能、性能、场景适用性比较,如HBase、Cassandra、Spanner等。 综上所述,尽管没有具体的内容可以分析,但可以确定的是,2021分布式数据库技术系列概览这篇文档将为读者...
分布式数据库是现代信息技术领域中的一个重要概念,特别是在大数据和云计算时代,其重要性日益凸显。2019年的分布式数据库考题可能涵盖了这个领域的核心概念、设计原则、系统架构以及实际应用等多个方面。以下是对...
近年来,随着微服务架构的普及,分布式数据库得到了更广泛的应用,如Apache Cassandra、MongoDB等,它们提供了高性能、高可用和可伸缩的解决方案。 【金融级分布式数据库的特性与需求】 金融行业对数据库的要求...
分布式数据库是现代信息技术领域中的一个重要概念,它涉及到多个物理存储位置上的数据库的集成管理,以实现数据的高可用性、可扩展性和容错性。在这个“分布式数据库课件和练习题”压缩包中,我们可以期待获取到关于...
### 分布式数据库选型方案 #### 一、分布式数据库的发展与分类 ##### 1.1 单机型数据库的历史背景 - **起源与发展**:单机型数据库起源于20世纪70年代,IBM的研究成果奠定了现代数据库的基础。随后,Oracle、DB2等...
Cassandra 是一个开源的分布式数据库系统,源自 Facebook,后来成为了 Apache 项目的一部分。它的设计灵感来源于 Dynamo 和 Bigtable,融合了两者的关键特性。Cassandra 提供了一个高度可扩展且容错性强的数据库解决...
4. Cassandra:Cassandra 是一款高度可扩展的分布式数据库,具有高性能、高可用性和高可靠性等优点,可以用于处理大规模的数据存储和计算。 分布式数据库的架构设计主要是将数据分散到多个数据库服务器上,并实现...
为您提供ApacheCassandra 分布式数据库下载,Apache Cassandra是一个混合型的非关系的数据库,开源分布式Key-Value存储系统,主要特性有分布式、基于column的结构化、高伸展性!软件介绍 当您需要可扩展性和高可用...
分布式数据库设计是现代大型互联网应用的核心技术之一,它允许数据在多台计算机上进行分散存储和处理,以提高系统的可扩展性和性能。本项目采用Java语言实现了一个分布式数据库系统,利用RMI(Remote Method ...
分布式数据库是现代大数据处理和高并发场景下的关键技术之一,它将数据分布在多个物理节点上,通过网络进行通信和协作,实现数据的透明访问和一致性保证。这份“分布式数据库课件资料宝典”无疑是深入理解这一领域的...