`

Cassandra 权威指南

 
阅读更多



 Cassandra 权威指南

基本信息

作者: (美)Eben Hewitt    [作译者介绍]

译者: 王旭

丛书名: 图灵程序设计丛书

出版社:人民邮电出版社

ISBN:9787115251121

上架时间:2011-7-4

出版日期:2011 年8月

http://product.china-pub.com/198403

 

 

《Cassandra 权威指南》电子书在线阅读

 

内容简介

  如果可以存储无限大规模的数据,你会用它们做什么呢?在这本实践指南中,你将会了解到apache cassandra是如何在多个数据中心中保存上百tb数据,并提供高可用的服务的。正是这些特性,让facebook、twitter以及其他拥有海量 数据的公司为之心动。《cassandra权威指南》介绍了cassandra的技术细节和在生产系统中使用cassandra的杰出范例。
  本书作者eben hewitt阐述了cassandra的非关系型设计的优势,着重介绍了它的数据模型。本书向开发者、dba、应用架构师和正在寻找数据库的可扩展性解决方案的管理者,展示了cassandra的速度和灵活性。

 
目录

 《cassandra 权威指南》 
第1 章 cassandra 概况  1
1.1 关系型数据库有什么问题  1
1.2 关系型数据库简单回顾  5
1.2.1 rdbms:出类拔萃与表现平平 6
1.2.2 互联网的规模  12
1.3 cassandra 的电梯间演讲  13
1.3.1 50 个字介绍cassandra 13
1.3.2 分布式与无中心 13
1.3.3 弹性可扩展  14
1.3.4 高可用与容错  15
1.3.5 可调节的一致性 15
1.3.6 brewer 的cap 理论  18
1.3.7 面向行  21
1.3.8 无schema 22
1.3.9 高性能  22
1.4 cassandra 来自何方 22
1.5 cassandra 的应用场景  23
1.5.1 大规模部署  23
1.5.2 写密集、统计和分析型工作 24

.1.5.3 地区分布  24
1.5.4 变化的应用  24
1.6 谁在使用cassandra 24
1.7 小结  26
第2 章 安装cassandra  27
2.1 安装二进制包 27
2.1.1 解压缩  27
2.1.2 里面有什么  27
2.2 从源码编译 28
2.2.1 其他编译目标  30
2.2.2 使用maven 编译  30
2.3 运行cassandra 30
2.3.1 在windows 平台上运行cassandra  31
2.3.2 在linux 下运行cassandra  31
2.3.3 启动服务器  32
2.4 使用命令行界面的客户端  33
2.5 基本命令行命令 34
2.5.1 帮助  34
2.5.2 连接服务器  35
2.5.3 描述环境  35
2.5.4 创建keyspace 和列族  36
2.5.5 读写数据  37
2.6 小结  38
第3 章 cassandra 的数据模型 39
3.1 关系型数据模型 39
3.2 简介  40
3.3 集群  43
3.4 keyspaces 43
3.5 列族  44
3.6 列 46
3.6.1 宽行与窄行  48
3.6.2 列的排序  49
3.7 超级列  50
3.8 cassandra 与rdbms 的设计差别  53
3.8.1 没有查询语言  53
3.8.2 没有引用完整性 53
3.8.3 第二索引  53
3.8.4 排序成为一种设计决策 54
3.8.5 反范式化  54
3.9 设计模式 55
3.9.1 具体化视图  56
3.9.2 无值列  56
3.9.3 聚合键  56
3.10 需要记住的几件事 57
3.11 小结  57
第4 章 应用实例  59
4.1 数据模型设计 59
4.2 酒店应用的关系型数据库设计  60
4.3 酒店应用的cassandra 设计  61
4.4 酒店应用代码 62
4.4.1 创建数据库  63
4.4.2 数据结构  64
4.4.3 进行连接  65
4.4.4 预装填数据库  66
4.4.5 搜索应用  78
4.5 twissandra  82
4.6 小结  82
第5 章 cassandra 的架构 83
5.1 system keyspace  83
5.2 对等结构(p2p) 84
5.3 gossip 与故障检测  84
5.4 逆熵与读修复 86
5.5 memtables、sstable 和commit log 87
5.6 提示移交 89
5.7 压紧  89
5.8 bloom filter 91
5.9 墓碑  91
5.10 分阶段事件驱动架构  92
5.11 管理器与服务 93
5.11.1 cassandra 守护进程  93
5.11.2 存储服务 93
5.11.3 消息服务 93
5.11.4 提示移交管理器  94
5.12 小结  94
第6 章 配置cassandra  95
6.1 keyspace  95
6.1.1 创建一个列族  98
6.1.2 从0.6 迁移到0.7  99
6.2 副本  99
6.3 副本放置策略 100
6.3.1 简单策略  101
6.3.2 旧网络拓扑策略 102
6.3.3 网络拓扑策略 103
6.4 副本因子  103
6.5 分区器 105
6.5.1 随机分区器  106
6.5.2 有序分区器  106
6.5.3 配页有序分区器 107
6.5.4 字节序分区器 107
6.6 snitch  107
6.6.1 simple snitch  107
6.6.2 propertyfilesnitch  107
6.7 创建集群  108
6.7.1 修改集群名称 109
6.7.2 给集群增加节点 109
6.7.3 多种子节点   111
6.8 动态加入环 113
6.9 安全  114
6.9.1 使用simpleauthenticator 114
6.9.2 编程鉴权  117
6.9.3 使用md5 加密 118
6.9.4 提供你自己的鉴权算法 118
6.10 杂项设置 119
6.11 附加工具 120
6.11.1 查看键值 120
6.11.2 导入之前版本的配置  120
6.12 小结  122
第7 章 读写数据  123
7.1 cassandra 与rdbms 查询的不同  123
7.1.1 没有update 查询  123
7.1.2 记录级的写原子性  123
7.1.3 不支持服务端事务  123
7.1.4 没有重复键值 124
7.2 写操作的基本属性 124
7.3 一致性级别 124
7.4 读操作的基本属性 126
7.5 api 126
7.6 设置与插入数据 128
7.7 使用简单的get 133
7.8 数据准备  135
7.9 切片谓词  135
7.9.1 使用get slice 读取特定列名 136
7.9.2 通过切片区间获取一组列 137
7.9.3 取出一行中的所有列 138
7.10 get range slices 138
7.11 multiget slice  140
7.12 删除  142
7.13 批量变更 144
7.13.1 批量删除 144
7.13.2 区间鬼影 145
7.14 编程定义keyspace 和列族  145
7.15 小结  146
第8 章 客户端 147
8.1 基本的客户端api 148
8.2 thrift 148
8.2.1 thrift 对java 的支持  151
8.2.2 异常  151
8.2.3 thrift 小结  152
8.3 avro  152
8.3.1 avro ant 目标  154
8.3.2 avro 规范155
8.3.3 avro 小结156
8.4 git 简介 156
8.5 连接客户端节点 157
8.5.1 客户端列表  157
8.5.2 循环dns 157
8.5.3 负载均衡器  157
8.6 cassandra web 控制台  157
8.7 hector (java) 161
8.7.1 特性  161
8.7.2 hector api  162
8.8 hectorsharp(c#) 162
8.9 chirper 167
8.10 chiton (python) 167
8.11 pelops (java)  168
8.12 kundera (java orm) 169
8.13 fauna (ruby) 169
8.14 小结  170
第9 章 监控 171
9.1 日志  171
9.1.1 跟踪查看  173
9.1.2 通用技巧  174
9.2 jmx 与mbean 概述  175
9.2.1 mbean 177
9.2.2 集成jmx 179
9.3 通过jmx 与cassandra 交互 180
9.4 cassandra 的mbean 181
9.4.1 org.apache.cassandra.concurrent 185
9.4.2 org.apache.cassandra.db.185
9.4.3 org.apache.cassandra.gms  186
9.4.4 org.apache.cassandra.service 186
9.5 定制cassandra 的mbean  188
9.6 运行时分析工具 190
9.6.1 使用jmx 和jhat 进行堆分析  191
9.6.2 发现线程问题 194
9.7 健康检查  195
9.8 小结  196
第10 章 维护  197
10.1 获取环的信息 198
10.1.1 info  198
10.1.2 ring 198
10.2 获取统计信息 199
10.2.1 使用cfstats  199
10.2.2 使用tpstats  200
10.3 基本维护工作 201
10.3.1 修复 201
10.3.2 刷写 202
10.3.3 清理 203
10.4 快照  203
10.4.1 进行快照 203
10.4.2 清除快照 204
10.5 对集群进行负载均衡  205
10.6 退服节点 208
10.7 更新节点 210
10.7.1 删除令牌 210
10.7.2 压紧阈值 210
10.7.3 在一个工作的集群中改变列族 210
10.8 小结  211
第11 章 性能调优 213
11.1 数据存储 213
11.2 回复超时 215
11.3 commit log  215
11.4 memtable 216
11.5 并发  216
11.6 缓存  217
11.7 缓冲区尺寸 218
11.8 使用python 压力测试 218
11.8.1 生成python thrift 接口 218
11.8.2 运行python 压力测试 220
11.9 启动和jvm 设置 222
11.10 小结 224
第12 章 集成hadoop 225
12.1 何为hadoop 225
12.2 使用mapreduce 226
12.3 运行字数统计例子 227
12.3.1 将数据输出到cassandra 229
12.3.2 hadoop 流 229
12.4 mapreduce 之上的工具  229
12.4.1 pig  230
12.4.2 hive 231
12.5 集群配置 231
12.6 案例  233
12.6.1 raptr.com: keith thornhill.233
12.6.2 imagini: dave gardner 233
12.7 小结  234
附录 非关系型数据库大观 235

 

 

 

 

  • 大小: 7.9 KB
0
2
分享到:
评论

相关推荐

    Cassandra 权威指南 大数据学习必备

    Cassandra 权威指南 大数据学习必备。 本书是一本广受好评的Cassandra图书。与传统的关系型数据库不同,Cassandra是一种开源的分布式存储系统。书中介绍了它无中心架构、高可用、无缝扩展等引人注目的特点,讲述了...

    Cassandra The Definitive Guide(2nd) azw3

    Cassandra The Definitive Guide(2nd) 英文azw3 第2版 本资源转载自网络,如有侵权,请联系上传者或csdn删除 本资源转载自网络,如有侵权,请联系上传者或csdn删除

    MASTERING_APACHE_CASSANDRA_3X_THIRD_EDITION.pdf

    本书《MASTERING_APACHE_CASSANDRA_3X_THIRD_EDITION.pdf》是关于Apache Cassandra 3.x版本的权威指南,主要针对提高数据库的可扩展性和可用性而不牺牲性能方面的深入讨论。本书由Aaron Ploetz、Tejaswi Malepati和...

    cassandra学习资料收集

    - “Cassandra权威指南(中文版).PDF”是学习Cassandra的必备书籍,涵盖了从基础概念到高级特性的全面内容,适合初学者和有经验的开发者。 通过这些学习资料,你可以深入理解Cassandra的核心原理,掌握其部署、管理...

    Hadoop权威指南第四版和第二版

    《Hadoop权威指南》是大数据领域的一本经典著作,它为读者深入理解并掌握Hadoop提供了全面而详尽的指导。第四版与第二版的对比,不仅展现了Hadoop技术的演进历程,也反映了大数据处理领域的最新发展。下面将分别就两...

    Hadoop权威指南 示例代码

    《Hadoop权威指南》是Hadoop领域的经典著作,旨在深入解析这一分布式计算框架的核心概念、工作原理以及实际应用。书中包含了大量的示例代码,帮助读者理解Hadoop的使用方法和最佳实践。这些示例代码覆盖了Hadoop生态...

    Hadoop权威指南(中文版-带目录索引)

    《Hadoop权威指南》是大数据领域的一本经典著作,它全面深入地介绍了Hadoop生态系统及其核心组件。Hadoop是Apache基金会开发的一个开源框架,主要用于处理和存储海量数据,尤其适合那些无法在单台机器上处理的数据量...

    高清版 Hadoop权威指南_第4版

    《高清版 Hadoop 权威指南_第4版》是一本深入探讨Hadoop技术的中文著作,旨在为读者提供全面、详细的Hadoop知识体系。Hadoop作为开源的大数据处理框架,已经成为大数据领域的核心工具,其分布式计算能力以及对大规模...

    Cassandra High Performance Cookbook

    《Cassandra High Performance Cookbook》是一本由Edward Capriolo撰写的关于Apache Cassandra性能调优的权威指南书籍。Apache Cassandra是一个高性能、可扩展的分布式NoSQL数据库系统,广泛用于处理大量数据,并...

    Netty权威指南最新第2版带书签

    它活跃和成长于用户社区,像大型公司 Facebook 和 Instagram 以及流行 开源项目如 Infinispan, HornetQ, Vert.x, Apache Cassandra 和 Elasticsearch 等,都利用其强大的对于网络抽象的核心代码。

    hadoop权威指南第四版

    《Hadoop权威指南》第四版是一本全面深入探讨Hadoop生态系统的重要著作,旨在为读者提供对这个分布式计算框架的深刻理解和实用技能。该书由Tom White撰写,是Hadoop开发者和使用者不可或缺的参考书籍。本资源包括...

    memcached权威指南.rar

    《Memcached权威指南》这本书是深入理解并掌握分布式缓存系统Memcached的重要参考资料。Memcached是一种高性能、分布式内存对象缓存系统,广泛应用于网站和应用程序中,以减轻数据库的负载,提高数据访问速度。以下...

    hadoop权威指南第三版

    《Hadoop权威指南第三版》是由Tom White编著的一本详细介绍Hadoop技术的书籍。Hadoop是一个开源框架,它允许使用简单的编程模型跨计算机集群存储和处理大规模数据集。该书自出版以来便广受推崇,成为了学习和使用...

    Hadoop权威指南 大数据的存储与分析-第4版

    《Hadoop权威指南 大数据的存储与分析-第4版》是一本深入解析Hadoop及其生态系统核心组件的专业书籍,旨在帮助读者理解如何利用Hadoop处理和分析大规模数据。Hadoop是Apache软件基金会的一个开源项目,它为分布式...

    MYCAT权威指南

    《MYCAT权威指南》是一本深入探讨Mycat这一开源分布式数据库中间件的专业书籍。Mycat作为Java语言实现的数据库中间件,是为解决大数据量、高并发场景下的数据库扩展问题而设计的。它支持分库分表、读写分离、数据...

    大型分布式应用技术资料合集(涵盖Hadoop Cassandra HBase NoSQL)

    《Hadoop权威指南》是了解Hadoop生态系统的基础读物,它深入介绍了Hadoop的MapReduce计算模型和HDFS文件系统。MapReduce将大型数据集分割为小块,通过并行处理加快计算速度,而HDFS则提供了高容错性和可扩展性的...

    spring-data-book:Spring数据-权威指南-适用于企业Java开发人员的现代数据访问

    《Spring数据-权威指南》是一本专为Java企业开发人员设计的现代数据访问技术书籍,主要围绕Spring Data框架展开,该框架是Spring生态系统中的一个重要组成部分,旨在简化数据访问层的开发工作。Spring Data支持多种...

Global site tag (gtag.js) - Google Analytics