Python 中文乱码问题

json.dumps在默认情况下,对于非ascii字符生成的是相对应的字符编码,而非原始字符,例如:

>>> import json
>>> js = json.loads('{"haha": "哈哈"}')
>>> print json.dumps(js)
{"haha": "\u54c8\u54c8"}

解决办法很简单:

>>> print json.dumps(js, ensure_ascii=False)   
{"haha": "哈哈"} 

 

Redis 中文乱码问题

在redis 中存储中文,读取会出现乱码(其实不是乱码,只是不是我们存的中文显示)

[root@174 ~]# redis-cli -p 6379
redis 127.0.0.1:6379> select 1       # 选择 db = 1
OK
redis 127.0.0.1:6379[1]> set test "阳光岛主"
OK
redis 127.0.0.1:6379[1]> get test
"\xe9\x98\xb3\xe5\x85\x89\xe5\xb2\x9b\xe4\xb8\xbb"       

 

如何在get时取到它的中文呢?只需要在redis-cli 后面加上 --raw
[root@174 ~]# redis-cli -p 6379 --raw
redis 127.0.0.1:6379> select 1
OK
redis 127.0.0.1:6379[1]> set test2 "阳光岛主"
OK
redis 127.0.0.1:6379[1]> get test2
阳光岛主
redis 127.0.0.1:6379[1]> get test        # 之前的乱码,也转成了中文
阳光岛主
redis 127.0.0.1:6379[1]> keys *          # 获取所有 keys
test
test2

 

Linux Shell 转换中文乱码:

[root@174 ~]# echo -e -n "\xe9\x98\xb3\xe5\x85\x89\xe5\xb2\x9b\xe4\xb8\xbb"   
阳光岛主