`
erichi101
  • 浏览: 11477 次
文章分类
社区版块
存档分类
最新评论

分析redis key大小的几种方法

阅读更多

 

当redis被用作缓存时,有时我们希望了解key的大小分布,或者想知道哪些key占的空间比较大。本文提供了几种方法。

一. bigKeys

这是redis-cli自带的一个命令。对整个redis进行扫描,寻找较大的key。例:

redis-cli -h b.redis -p 1959 --bigkeys

输出:

# Scanning the entire keyspace to find biggest keys as well as
# average sizes per key type.  You can use -i 0.1 to sleep 0.1 sec
# per 100 SCAN commands (not usually needed).

[00.00%] Biggest hash   found so far 's_9329222' with 3 fields
[00.00%] Biggest string found so far 'url_http://mini.eastday.com/mobile/170722090206890.html?qid=sgllq&ch=east_sogou_push&pushid=13' with 8 bytes
[00.00%] Biggest string found so far 'foo' with 40 bytes
[00.00%] Biggest hash   found so far 's_9329084' with 4 fields
[00.23%] Biggest zset   found so far 'region_hot_菏泽地' with 625 members
[00.23%] Biggest zset   found so far 'region_hot_葫芦岛' with 914 members
[00.47%] Biggest string found so far 'top_notice_list' with 135193 bytes
[00.73%] Biggest zset   found so far 'region_hot_自贡' with 2092 members
[01.90%] Biggest hash   found so far 'uno_facet_2018-12-20' with 59 fields
[11.87%] Biggest zset   found so far 'region_hot_上海' with 2233 members
[27.05%] Biggest set    found so far 'blacklist_set_key' with 31832 members
[73.87%] Biggest string found so far 'PUSH_NEWS' with 3104237 bytes
[86.18%] Biggest zset   found so far 'region_hot_北京' with 2688 members

-------- summary -------

Sampled 4263 keys in the keyspace!
Total key length in bytes is 174847 (avg len 41.02)

Biggest string found 'PUSH_NEWS' has 3104237 bytes
Biggest    set found 'blacklist_set_key' has 31832 members
Biggest   hash found 'uno_facet_2018-12-20' has 59 fields
Biggest   zset found 'region_hot_北京' has 2688 members

1616 strings with 3771161 bytes (37.91% of keys, avg size 2333.64)
0 lists with 0 items (00.00% of keys, avg size 0.00)
1 sets with 31832 members (00.02% of keys, avg size 31832.00)
2353 hashs with 7792 fields (55.20% of keys, avg size 3.31)
293 zsets with 333670 members (06.87% of keys, avg size 1138.81)

说明:

  1. 该命令使用scan方式对key进行统计,所以使用时无需担心对redis造成阻塞。
  2. 输出大概分为两部分,summary之上的部分,只是显示了扫描的过程。summary部分给出了每种数据结构中最大的Key。
  3. 统计出的最大key只有string类型是以字节长度为衡量标准的。list,set,zset等都是以元素个数作为衡量标准,不能说明其占的内存就一定多。所以,如果你的Key主要以string类型存在,这种方法就比较适合。

更多关于bigkeys的说明可以参考这里

二. debug object key

redis的命令,可以查看某个key序列化后的长度。
例:

连接上redis后执行如下命令

b.redis:1959> hmset myhash k1 v1 k2 v2 k3 v3
OK
b.redis:1959> debug object myhash
Value at:0x7f005c6920a0 refcount:1 encoding:ziplist serializedlength:36 lru:3341677 lru_seconds_idle:2

关于输出的项的说明:

  • Value at:key的内存地址
  • refcount:引用次数
  • encoding:编码类型
  • serializedlength:序列化长度
  • lru_seconds_idle:空闲时间
    关于refcount, encoding, lru_seconds_idle的更详细解释可以参考这里

几个需要注意的问题

  • serializedlength是key序列化后的长度(redis在将key保存为rdb文件时使用了该算法),并不是key在内存中的真正长度。这就像一个数组在json_encode后的长度与其在内存中的真正长度并不相同。不过,它侧面反应了一个key的长度,可以用于比较两个key的大小。
  • serializedlength会对字串做一些可能的压缩。如果有些字串的压缩比特别高,那么在比较时会出现问题。比如下列:
b.redis:1959> set str1 aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
OK
b.redis:1959> set str2 abcdefghijklmnopqrstuvwxyz1234
OK
b.redis:1959> debug object str1
Value at:0x7f007c035b80 refcount:1 encoding:embstr serializedlength:12 lru:3342615 lru_seconds_idle:13
b.redis:1959> debug object str2
Value at:0x7f00654df400 refcount:1 encoding:embstr serializedlength:31 lru:3342622 lru_seconds_idle:7

两个字串的实际长度都是30, 但str1的serializedlength为12, str2的为31。

  • redis的官方文档不是特别建议在客户端使用该命令,可能因为计算serializedlength的代价相对高。所以如果要统计的key比较多,就不适合这种方法。

三. redis rdb tools

这是一个redis rdb file的分析工具,可以根据rdb file生成内存报告。

3.1 安装

需要python2.4以上版本和pip。

pip install rdbtools

3.2 生成内存报告

首先我们需要有一份rdb文件,如果你在配置中开启了rdb,那么redis会自动生成rdb文件。如果没有,可以手动执行bgsave。如果是线上机器,执行时要考虑机器负载等问题。拿到rdb文件后,我们就可以生成内存报告了。命令如下:

rdb -c memory file 

例:

rdb -c memory /tmp/dump.rdb 
database,type,key,size_in_bytes,encoding,num_elements,len_largest_element,expiry
0,hash,data:index_flow_yingshi,10492,hashtable,1,8992,2019-01-14T08:20:10.236000
0,hash,data:index_movie,22068,hashtable,7,2896,2019-01-14T07:29:19.685000
0,string,block:index_module_novel,8296,string,7694,7694,2019-01-13T00:27:46.128000
0,string,block:index_bottom_baike_aikan,8296,string,7632,7632,2019-01-14T02:27:11.850000
0,string,block:index_bottom_tools,5224,string,4549,4549,2019-01-13T01:02:09.171000
0,string,block:index_module_travel,7272,string,6408,6408,2019-01-13T00:43:39.478000
...

输出了db,数据类型,key, 大小, 编码等多列信息。至于分析数据,你可以用shell,也可以保存成csv用excel排序,或者干脆存到db里,想怎么排怎么排。

如果只要知道最大的N个key, 可以使用-l选项。例:

[@sjs_73_171 ~]$ rdb -c memory -l 3 /tmp/dump.rdb  
database,type,key,size_in_bytes,encoding,num_elements,len_largest_element,expiry
0,hash,city_tong,724236,hashtable,3113,216,2019-01-14T01:10:59.407000
0,hash,iplocsearch,406292,hashtable,383,180190,2019-01-30T05:37:56.082000
0,hash,weather_tong3,583844,hashtable,319,1658,2019-01-07T10:22:33.742000

3.3 查看单个key

如果我们只需要查询单个key所使用的内存可以不必依赖rdb file, 使用redis-memory-for-key命令即可。
例:

[@sjs_73_171 WEB-INF]$ redis-memory-for-key -s b.redis -p 1959 myhash
Key                             myhash
Bytes                           83
Type                            hash
Encoding                        ziplist
Number of Elements              3
Length of Largest Element       2

[@sjs_73_171 WEB-INF]$ redis-memory-for-key -s b.redis -p 1959 str1
Key                             str1
Bytes                           80
Type                            string

[@sjs_73_171 WEB-INF]$ redis-memory-for-key -s b.redis -p 1959 str2
Key                             str2
Bytes                           80
Type                            string

3.4 更多

  • 工具得出的内存值为近似值,这点可以参看作者的说明。"Why doesn't reported memory match actual memory used?"
  • 工具通过分析rdb file中的key及value,反算出该kv在内存中的大小。计算时充分考虑了数据类型的影响,key本身长度的影响,内存分配等多种因素。虽然得出的大小不是真实值,但用于key大小的比较是完全可以的。
  • rdb的功能不仅于此,它还可以将kv导成json格式,也可以按正则表达式只导出部分key,
    更多使用方法可以查看
rdb --help

也可以查看git上的帮助文档

 

四. 总结

  • 如果想粗略的看下最大key, 可以使用bigKeys。
  • 如果查询的key不多,key的压缩比又没有明显差异,可以使用debug object key。
  • 如果不介意安装个工具,那么redis rdb tools似乎是最佳选择。
分享到:
评论

相关推荐

    Go-通过Key前缀分析Redis的内存占用按内存大小排序导出结果到csv文件

    在IT行业中,尤其是在数据库管理...通过以上知识点,我们可以理解如何使用Go语言编写一个工具,该工具能够分析Redis数据库中特定Key前缀的内存占用,并按大小排序导出到CSV文件,这对于监控和优化Redis性能非常有帮助。

    Redis大Key解决方案.docx

    对于这种情况,可以考虑以下几种方法: 1. **对象拆分**: - 如果该Key需要每次都整存整取,可以尝试将对象分拆成多个较小的键值对,并使用`MULTIGET`命令一次性获取多个值。这样做的目的是分散单次操作的压力,...

    Redis常见50问

    Redis提供了几种数据淘汰策略来应对内存限制: 1. noeviction:内存满时,拒绝执行可能导致内存增加的命令。 2. allkeys-lru:回收最不常用的键。 3. volatile-lru:仅回收已过期的键中最不常用的。 4. allkeys-...

    30道Redis面试题.docx

    在内存不足时,Redis 提供了几种数据淘汰策略,如 noeviction(不删除)、allkeys-lru(回收最近最少使用的 Key)、volatile-lru(只在有过期时间的 Key 中回收)、allkeys-random(随机删除)、volatile-random(在...

    redis集群方法大全

    Redis集群是一种无中心的分布式的多主复制模式,它通过将数据分布在多个Redis节点上来提高性能和可用性。集群中每个节点都保存着一部分数据,并且能够处理客户端请求。当某个节点发生故障时,集群能够自动检测并进行...

    spring整合redis3.2/redis2.1 jar包

    Spring 整合 Redis 是在 Java 开发中常用的一种技术,用于提升应用的缓存和数据处理性能。Redis 是一个开源的、基于键值对的数据存储系统,常被用作数据库、缓存和消息中间件。它支持多种数据结构,如字符串、哈希、...

    redis代码示例

    在Redis测试demo中,我们通常会遇到以下几种操作: 1. 设置键值对: ```python redis.set('key', 'value') ``` 2. 获取键值: ```python value = redis.get('key') ``` 3. 删除键: ```python redis....

    Redis源代码分析

    下面将详细介绍其中几种数据结构: ##### 2.1 链表 (adlist.h/adlist.c) 链表是Redis中最基础的数据结构之一,用于构建各种复杂的数据结构,如Redis的键空间(keyspace)、过期键的定时任务等。 - **基本数据结构**...

    redis内存存储结构分析

    针对Redis内存占用问题,可以采取以下几种策略进行优化: 1. **数据分层**:通过将热点数据与冷数据分开存储,只将热点数据放在内存中。 2. **数据压缩**:对于大文本数据,可以考虑在写入Redis之前先进行压缩处理...

    redis之string介绍

    其中`sds`(Simple Dynamic String)是Redis自定义的一种动态字符串实现,与C语言的标准字符串相比,它具有以下几个优点: 1. **常数复杂度获取字符串长度**:`sds`结构体中维护了一个额外的变量来记录字符串长度,...

    redis-6.2.6编译版本

    - **内存管理**: Redis 将所有数据存储在内存中,因此需要关注内存大小和内存使用策略。 - **性能监控**: 定期检查 CPU 和内存使用情况,避免资源瓶颈。 - **安全措施**: 设置访问控制,限制非授权访问,避免数据...

    redis安装的版本和配置文件

    6. **客户端连接**:可以使用`redis-cli`命令行工具与Redis服务器进行交互,例如`set key value`设置键值对,`get key`读取键值。 7. **守护进程模式**:为了在后台运行Redis,可以在启动时添加`--daemonize yes`...

    Redis学习笔记-安装、性能、复制等

    Redis支持以下几种主要的数据类型: - **String(字符串)**:最基础的数据类型,可用于简单的键值存储。 - **List(列表)**:有序的字符串列表,适合实现队列或栈。 - **Set(集合)**:无序的字符串集合,支持...

    征服 Redis + Jedis

    2. **操作命令**:通过Jedis对象调用各种方法执行Redis命令,如`set(key, value)`用于设置键值对,`get(key)`用于获取键对应的值。 3. **事务处理**:Jedis支持Redis的事务功能,可以使用`multi()`、`exec()`和`...

    REDIS缓存数据库在JAVA中的使用ppt

    Redis是一种高性能的键值对数据存储系统,常被用作数据库、缓存和消息代理。在Java开发中,Redis的使用能显著提升应用程序的性能,因为它提供了高速的数据读写能力。接下来,我们将深入探讨Redis在Java应用中的使用...

    美团redis实践

    AOF(Append Only File)是Redis的一种持久化策略,当AOF文件增长到一定大小时,Redis会进行重写操作以压缩文件大小。美团通过集中控制bgrewriteaof来管理AOF重写过程,同时收集AOF的元信息(如大小、时间等),以便...

    redis详细介绍

    Redis的核心数据结构是基于哈希表实现的,每个键(key)都是一种简单的动态字符串(sds),而值(value)则是Redis对象(redisobject)。这种设计允许Redis不仅能够存储基本的数据类型,还能存储更复杂的结构。例如: - **...

    redis持久化方式

    为了保证数据的安全性和持久性,Redis 提供了两种主要的持久化机制:RDB 快照(Redis Database Backup)和 AOF(Append Only File)。本文将详细介绍这两种持久化方式的原理、配置方法及其各自的优缺点。 #### RDB ...

    Redis面试题(含答案)_20190220222533.pdf

    Redis集群方案主要有以下几种: 1. **Twemproxy**:类似于代理服务器的角色,使用简单,但存在单点压力问题。 2. **Codis**:与Twemproxy相似,但在节点变化时能自动调整数据分布。 3. **Redis Cluster 3.0**:内置...

Global site tag (gtag.js) - Google Analytics