redis 排序命令

redis支持对list,setsorted set元素的排序

sort 排序命令格式: 

sort key [BY pattern] [LIMIT start count] [GET pattern] [ASC | DESC] [ALPHA] [STORE dstkey]  

 

1) sort key list

list是最简单的情况,没有任何选项对集合自身元素排序并返回排序结果,默认为value升序。

示例:

127.0.0.1:6379> lpush mimvp 12
(integer) 1
127.0.0.1:6379> lpush mimvp 11
(integer) 2
127.0.0.1:6379> lpush mimvp 13
(integer) 3
127.0.0.1:6379> lpush mimvp 10
(integer) 4
127.0.0.1:6379> lrange mimvp 0 -1
1) "10"
2) "13"
3) "11"
4) "12"
127.0.0.1:6379>
sort mimvp
1) "10"
2) "11"
3) "12"
4) "13"
127.0.0.1:6379>
sort mimvp desc
1) "13"
2) "12"
3) "11"
4) "10"

 

2) [ASC | DESC] [ALPHA]  list

sort默认的排序方式(asc)是从小到大排的升序,当然也可以按照逆序或者按字符顺序排。

逆序可以加上desc选项,想按字母顺序排可以加alpha选项,alpha可以和desc一起用。

sort 默认以分数(数值)排序,字母使用默认的sort排序,会报错!

示例:

127.0.0.1:6379> lpush mylist forum
(integer) 1
127.0.0.1:6379> lpush mylist proxy
(integer) 2
127.0.0.1:6379> lpush mylist blog
(integer) 3
127.0.0.1:6379> lpush mylist apptop
(integer) 4
127.0.0.1:6379>
sort mylist
(error) ERR One or more scores can't be converted into double
127.0.0.1:6379> sort mylist alpha
1) "apptop"
2) "blog"
3) "forum"
4) "proxy"
127.0.0.1:6379>
sort mylist alpha desc
1) "proxy"
2) "forum"
3) "blog"
4) "apptop"
127.0.0.1:6379>
sort mylist desc alpha
1) "proxy"
2) "forum"
3) "blog"
4) "apptop"

 

3) [BY pattern]   set

除了可以按集合元素自身值(数字,字母)排序外,还可以将集合元素内容按照给定pattern组合成新的key,并按照新key中对应的内容进行排序。

示例:

127.0.0.1:6379> set mimvp_12 mimvp_12
OK
127.0.0.1:6379> set mimvp_11 mimvp_11
OK
127.0.0.1:6379> set mimvp_13 mimvp_13
OK
127.0.0.1:6379> set mimvp_10 mimvp_10
OK
127.0.0.1:6379>
sort mimvp by mimvp_*         // mimvp_* 是字符串,因此需要alpha
(error) ERR One or more scores can't be converted into double
127.0.0.1:6379> sort mimvp by mimvp_* alpha
1) "10"
2) "11"
3) "12"
4) "13"
127.0.0.1:6379>
sort mimvp by mimvp_* alpha desc
1) "13"
2) "12"
3) "11"
4) "10"

*代表了上面示例1) mimvp已经给出的元素值,所以这个排序是按照mimvp_12, mimvp_11,mimvp_13,mimvp_10这四个key对应值排序的,但返回的仍然是排序后mimvp集合中的元素,即数值13,11,12,10,而不是mimvp_*的字符串元素。

 

4) [GET pattern] 

上面的例子都是返回的mimvp集合中的数值元素,也可以通过get选项去获取指定pattern作为新key(mimvp_*)对应的字符串值。

示例:

127.0.0.1:6379> sort mimvp by mimvp_* get mimvp_* alpha
1) "mimvp_10"
2) "mimvp_11"
3) "mimvp_12"
4) "mimvp_13"
127.0.0.1:6379>
sort mimvp by mimvp_* get mimvp_* alpha desc
1) "mimvp_13"
2) "mimvp_12"
3) "mimvp_11"
4) "mimvp_10"

这次返回的就不在是mimvp中的元素,而是mimvp_12, mimvp_11,mimvp_13,mimvp_10对应的值,当然排序是按照mimvp_12, mimvp_11,mimvp_13,mimvp_10值并根据字母顺序排的。

另外,get选项可以有多个,#特殊符号引用的是原始集合也就是mimvp(类似与sorted-set withscores)

示例

127.0.0.1:6379> sort mimvp by mimvp_* get mimvp_* get # alpha
1) "mimvp_10"
2) "10"
3) "mimvp_11"
4) "11"
5) "mimvp_12"
6) "12"
7) "mimvp_13"
8) "13"
127.0.0.1:6379>
sort mimvp by mimvp_* get mimvp_* get # alpha desc
1) "mimvp_13"
2) "13"
3) "mimvp_12"
4) "12"
5) "mimvp_11"
6) "11"
7) "mimvp_10"
8) "10"

最后在还有一个引用hash类型字段的特殊字符 ->   hash

示例:

127.0.0.1:6379> hset user_12 name yanggang
(integer) 1
127.0.0.1:6379> hset user_11 name yangjie
(integer) 1
127.0.0.1:6379> hset user_13 name yangliang
(integer) 1
127.0.0.1:6379> hset user_10 name yangchuang
(integer) 1
127.0.0.1:6379>
sort mimvp get user_*->name
1) "yangchuang"
2) "yangjie"
3) "yanggang"
4) "yangliang"
127.0.0.1:6379>
sort mimvp get user_*->name desc
1) "yangliang"
2) "yanggang"
3) "yangjie"
4) "yangchuang"

很容易理解,如果mimvp当对应的数值不存在,则对应返回的是nil 

 

5) [LIMIT start count]  limit

上面例子返回结果都是全部元素,limit选项可以限定返回结果的数量。

示例:

127.0.0.1:6379> sort mimvp get mimvp_* limit 1 2
1) "mimvp_11"
2) "mimvp_12"
127.0.0.1:6379> sort mimvp get mimvp_* limit 0 3
1) "mimvp_10"
2) "mimvp_11"
3) "mimvp_12"

start下标是从 0 开始,这里的limit选项(limit 1 2)意思是从第二个元素开始获取2个。

 

6) [STORE dstkey]   store

如果对集合经常按照固定的模式去排序,那么把排序结果缓存起来会减少不少cpu开销,使用store选项可以将排序内容保存到指定key中,保存的类型是list

127.0.0.1:6379> sort mimvp get mimvp_* limit 0 3 store mimvp_store
(integer) 3
127.0.0.1:6379> type mimvp_store
list
127.0.0.1:6379> lrange mimvp_store 0 -1
1) "mimvp_10"
2) "mimvp_11"
3) "mimvp_12"

这个例子将排序结果保存到mimvp_store中,后面使用直接从mimvp_store提取即可。

 

小结

功能介绍完后,再讨论下关于排序的一些问题。

如果有多个redis server的话,不同的key可能存在于不同的server上。

比如mimvp_12, mimvp_11,mimvp_13,mimvp_10,很有可能分别在四个不同的server上存贮着,这种情况会对排序性能造成很大的影响。

redis作者在他的blog上提到了这个问题的解决办法,就是通过key tag将需要排序的key都放到同一个server上 。由于具体决定哪个key存在哪个服务器上一般都是在client端hash的办法来做的,我们可以通过只对key的部分进行hash

举个例子:

假如我们 的client如果发现key中包含[],那么只对key中[]包含的内容进行hash,我们将四个name相关的key,都这样命名[name]12 [name]13 [name]11 [name]10,于是client 程序就会把他们都放到同一server上(不知道jredis实现了没)。 

 

还有一个问题也比较严重

如果要sort的集合非常大,排序就会消耗很长时间。

由于redis单线程的,所以长时间的排序操作会阻塞其他client的 请求。

解决办法是通过主从复制机制将数据复制到多个slave上。

然后我们只在slave上做排序操作,并尽可能的对排序结果缓存

另外就是一个方案是就是采用sorted set对需要按某个顺序访问的集合建立索引。

示例:

127.0.0.1:6379> sadd tom:friend:list 123        # tom的好友列表里面是好友的uid 
(integer) 1
127.0.0.1:6379> sadd tom:friend:list 456
(integer) 1
127.0.0.1:6379> sadd tom:friend:list 789
(integer) 1
127.0.0.1:6379> sadd tom:friend:list 101
(integer) 1
127.0.0.1:6379> set uid:sort:123 1000            
# uid对应的成绩 
OK
127.0.0.1:6379> set uid:sort:456 6000 
OK
127.0.0.1:6379> set uid:sort:789 100
OK
127.0.0.1:6379> set uid:sort:101 5999 
OK
127.0.0.1:6379> set uid:123 "{'uid':123,'name':'lucy'}"          
 # 增加uid对应好友信息
OK
127.0.0.1:6379> set uid:456 "{'uid':456,'name':'jack'}"
OK
127.0.0.1:6379> set uid:789 "{'uid':789,'name':'marry'}" 
OK
127.0.0.1:6379> set uid:101 "{'uid':101,'name':'icej'}"  
OK
127.0.0.1:6379>
sort tom:friend:list by uid:sort:* get uid:*    # 从好友列表中获得id与uid:sort字段匹配后排序,并根据排序后的顺序,用key在uid表获得信息 
1) "{'uid':789,'name':'marry'}"
2) "{'uid':123,'name':'lucy'}"
3) "{'uid':101,'name':'icej'}"
4) "{'uid':456,'name':'jack'}"
127.0.0.1:6379>
sort tom:friend:list by uid:sort:* get uid:* get uid:sort:* 
1) "{'uid':789,'name':'marry'}"
2) "100"
3) "{'uid':123,'name':'lucy'}"
4) "1000"
5) "{'uid':101,'name':'icej'}"
6) "5999"
7) "{'uid':456,'name':'jack'}"
8) "6000"

 

问题与分析

1.  sort mimvp by mimvp_* get mimvp_* get # alpha 为什么会按照 10 - 13 的顺序排下来,这个跟单纯的排序name*和name * alpha的结果都不一样

这个问题要从redis的实现逻辑上来分析了

a) list在插入后,默认是按照时间的先后反序排列的(先进后出,FILO) , lrange ml 0 -1,结果是:12 13 11 10. 这是因为list插入时是将最新的item插入到链表头

b) sort mimvp by mimvp_* 确定是会按照mimvp_*的值进行排序的。但当mimvp_*对应的value不是num型并且没有设置alpha的时候,会导致排序分值都是相同的,因为程序将把mimvp_*对应的值尝试转换为nun型

c) 这就会导致sort mimvp by mimvp_*会按照ml的自然顺序进行排列了

if (alpha) {
	if (sortby) {
		vector[j].u.cmpobj = getDecodedObject(byval);
	}
} 
else {
	if (byval->encoding == REDIS_ENCODING_RAW) {
		vector[j].u.score = strtod(byval->ptr,NULL);
	} 
	else if (byval->encoding == REDIS_ENCODING_INT) {
		/* Don't need to decode the object if it's
		 * integer-encoded (the only encoding supported) so
		 * far. We can just cast it 
		 */
		vector[j].u.score = (long)byval->ptr;
	} 
	else {
		redisAssert(1 != 1); 
	}   
}   

 

 

参考推荐

PHP redis sort 排序函数

PHP-redis 中文文档

php-redis 各种函数中文手册