Tokyo Cabinet 的四种数据结构

yiihsia

浏览: 68757 次
性别:
来自: 杭州

最近访客更多访客>>

libisthanks

qq85609655

noyousjtu

wlj5240

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Nosql

数据结构 SQL memcached F#

Tokyo Cabinet提供了Hash、Fixed-length、Table和B+ Tree四种数据结构，不同的结构特性和应用场景都不一样。TC本身提供了专门测试和调试工具tc (h/f/t/b) mgr。

Tokyo Tyrant在启动的时候，通过数据库文件名后缀来表示使用哪种数据结构。
以下是结构和后缀对应表：

Hash Database ：.tch
B+ tree database ：.tcb
fixed-length database ：.tcf
table database ：.tct
内存Hash Database ：*
内存B+ tree database ：+

启动时，还可以根据不同数据结构设置不同参数，用#开始，参数和值用=分开，例如/ttserver/database.tch#capnum=1#capsiz=1

参数含义如下，适用于TT：

capnum ：设置记录的最大容量
capsiz ：设置内存型database的内存容量，内存不足记录将按照顺序移除
mode ：可选的选项：w (写)、r (读)、c (创建)、t (截断)、t (无锁)、f (非阻塞锁)。默认值为：wc
idx ：设置索引的列名，用:分割
opts ：可选的选项：l (64位bucket数组，database容量可以超过2G)、d (Deflate压缩)、b(BZIP2压缩)、t(TCBS压缩)
bnum ：bucket的数量
apow ：specifies the size of record alignment by power of 2. 如果负数，设置无效
fpow ：specifies the maximum number of elements of the free block pool by power of 2. 如果负数，设置无效
rcnum ：设置缓存记录的最大数，如果数值不是大于0则会禁用缓存，默认禁用
lcnum ：设置缓存叶节点(leaf nodes)的最大数，如果数值不是大于0则会禁用缓存，默认值4096
ncnum ：设置缓存非叶节点(non-leaf nodes)的最大数，如果数值不是大于0则会禁用缓存，默认值512
xmsiz ：设置额外内存映射容量，如果数值不是大于0则会禁用内存映射，默认值67108864
dfunit ：specifie the unit step number. If it is not more than 0, the auto defragmentation is disabled. It is disabled by default.
width ：设置记录的固定大小，如果数值不是大于0，则默认是255
limsiz ：设置数据库文件的大小，如果数值不是大于0，则默认是268435456
lmemb ：设置每个叶节点页(leaf page)的成员数，如果数值不是大于0，则默认是128
nmemb ：设置每个非叶节点页(non-leaf page)的成员数，如果数值不是大于0，则默认是256

TC有自己的一套读写缓冲机制，通过xmsiz设置内存缓冲大小，这个参数对整体性能影响比较大。

一、Hash Database
Hash Database是最基本的结构了，只提供key-value存储方式，类似于memcached，Hash Database的特点是查找速度很快，bucket越多，数据越分散，查找越快。

Hash database支持的参数有："mode", "bnum", "apow", "fpow", "opts", "rcnum", "xmsiz", 和 "dfunit".
内存Hash Database支持的参数有："bnum", "capnum", 和 "capsiz"

二、Fixed-length Database
Fixed-length Database的读写速度是最快的，并且存储所需的空间是最小的(因为不需要存储数据以外的结构关系，但是因为是定长的，所以会有空间浪费)，key只能是数字，而value的长度是有限的，所以必须设置一个合适的value长度，太长会浪费空间，间接影响性能(TPS)。

Fixed-length database支持的参数有："mode", "width", 和 "limsiz".

创建数据库

Java代码 
[root@localhost ~]# tcfmgr create user.f  

插入数据

Java代码 
[root@localhost ~]# tcfmgr put user.f 123 00  
[root@localhost ~]# tcfmgr put user.f 124 'aa'  

查询

Java代码 
[root@localhost ~]# tcfmgr get user.f 123  
00  

三、B+ Tree Database
B+ Tree Database的特点是一个key可以有重复value，而且允许在value之间上下移动，value按插入顺序排列，可以范围查找key，也可以前缀查找key，查找的复杂度是O(log n)，所以n越大性能越低。

B+ tree database支持的参数有："mode", "lmemb", "nmemb", "bnum", "apow", "fpow", "opts", "lcnum", "ncnum", "xmsiz", and "dfunit"
内存B+ Tree Database支持的参数有："capnum" and "capsiz".

创建数据库

Java代码 
[root@localhost ~]# tcbmgr create user  

插入记录，重复key

Java代码 
[root@localhost ~]# tcbmgr put -dd user u1 123  
[root@localhost ~]# tcbmgr put -dd user u1 456  
[root@localhost ~]# tcbmgr put -dd user u1 789  
[root@localhost ~]# tcbmgr put -dd user u2 abc  
[root@localhost ~]# tcbmgr put -dd user u2 efg  

查询所有记录

Java代码 
[root@localhost ~]# tcbmgr list -pv user  
u1      123  
u1      456  
u1      789  
u2      abc  
u2      efg  

前缀查找

Java代码 
[root@localhost ~]# tcbmgr list -pv -fm u1 user  
u1      123  
u1      456  
u1      789  

范围查找

Java代码 
[root@localhost ~]# tcbmgr list -pv -rb u1 u2 user  
u1      123  
u1      456  
u1      789  
u2      abc  
u2      efg  

四、Table Database
Table Database的特点是支持检索，支持多列字段，支持列索引，性能不如其它结构。
Table Database提供了类似RMDB的存储功能，一个主键可以有多个字段，例如，在RMDB中user表可能会有user_id、name和password等字段，而在Table Database也提供这种支持。

Table database支持的参数有："mode", "bnum", "apow", "fpow", "opts", "rcnum", "lcnum", "ncnum", "xmsiz", "dfunit", and "idx".

1.类RMDB的表结构
Table Database最大的特点是支持类RMDB的表结构功能。
创建user表

Java代码 
[root@localhost ttserver]# tctmgr create user  

向表里插入记录

Java代码 
[root@localhost ttserver]# tctmgr put user 1 "name" "u1" "password" "123"  
[root@localhost ttserver]# tctmgr put user 3 "name" "u3" "password" "123456"  
[root@localhost ttserver]# tctmgr put user 9 "name" "u9" "password" "123456789"  

删除记录

Java代码 
[root@localhost ttserver]# tctmgr out user 3  

2.查询
查询所有记录

Java代码 
[root@localhost ttserver]# tctmgr list -pv user  
1       name    u1      password        123  
3       name    u3      password        123456  
9       name    u9      password        123456789  

通过主键查询

Java代码 
[root@localhost ttserver]# tctmgr get user 1  
name    u1  
password        123  

通过其它字段查询

Java代码 
[root@localhost ttserver]# tctmgr search -pv user name STREQ "u1"  
1       name    u1      password        123  
[root@localhost ttserver]# tctmgr search -pv user name STREQ "u1" password STREQ "123"  
1       name    u1      password        123  

附查询条件表达式（前面加~，相当于标准sql中的非）[资料来源采用tokyo cabinet搭建表格型DBM]

STREQ ：完全包含字符串，相当于标准sql中的where 字段=‘字符串’
STRINC ：包含此字符串，相当于标准sql中like ‘*字符串*’
STRBW ：以此字符串开头的内容，相当于标准sql中like ‘字符串*’
STREW ：以此字符串结尾的内容，相当于标准sql中like ‘*字符串’
STRAND ：包含在某区间内的内容，如标准sql中like ‘a-z’，那么他只能是a到z的字母
STROR ：不包含在某区间内的内容，如标准sql中like ‘!a-z’，那么他只能是数字或其他的符号
STRRX ：组合式结构，如标准sql中like “a“!b-m”#”
NUMEQ ：数值大小一样相当于标准sql中 where a=‘1’
NUMGT ：数值大于某一值相当于标准sql中 where a>‘1’
NUMGE ：数值大于等于某一值相当于标准sql中 where a>=‘1’
NUMLT ：数值小于某一值相当于标准sql中 where a<‘1’
NUMLE ：数值小于某一值相当于标准sql中 where a<=‘1’
NUMBT ：数值处于某一数值区间，相当于标准sql中 where a> 1 and a < 10
NUMOREQ ：数值不处于某一数值的区间，如果是a大于1，小于10的话，那这个表达式右边的内容应该相当于标准sql中 where a< 1 or a > 10

3.排序

Java代码 
[root@localhost ttserver]# tctmgr search -pv -ord name STRDESC user  
9       name    u9      password        123456789  
3       name    u3      password        123456  
1       name    u1      password        123  

排序参数含义如下：

Java代码 
STRASC：按字符升序  
STRDESC：按字符降序  
NUMASC：按数字升序  
NUMDESC：按字符降序  

4.设置索引

Java代码 
[root@localhost ttserver]# tctmgr setindex -it "lexical" user name  

索引类型

Java代码 
lexical：词汇  
decimal：数字  
token：不明白  
qgram：不明白  
void：不明白  

5.tctmgr
tctmgr支持的命令和参数

Java代码 
tctmgr create [-tl] [-td|-tb|-tt|-tx] path [bnum [apow [fpow]]]  
创建数据库  
tctmgr inform [-nl|-nb] path  
输出数据库的状况  
tctmgr put [-nl|-nb] [-sx] [-dk|-dc|-dai|-dad] path pkey [cols ...]  
创建记录  
tctmgr out [-nl|-nb] [-sx] path pkey  
删除记录  
tctmgr get [-nl|-nb] [-sx] [-px] [-pz] path pkey  
通过主键查询记录  
tctmgr list [-nl|-nb] [-m num] [-pv] [-px] [-fm str] path  
font-size: 1em; margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 38px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 10px; border-left-width: 1px; border-left-style: solid; border-left-color: #d1d7dc; background-color: #fafafa; line-height:

  分享到：
      
      tokyotyrant的内部实现特征
      |
       redis的内存陷阱
    
    2010-11-11 21:11
浏览 1549
评论(0)
分类:数据库
查看更多
    
    评论
    
发表评论   您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论