今天做网页到了测试和数据库交互的地方,其中HTML和数据库都是设置成utf-8格式编码,插入到数据库中是正确的,但是当读取出来的时候就会出错,原因就是python的str默认是ascii编码,和unicode编码冲突,就会报这个标题错误。

那么该怎样解决呢?通过搜集网上的资料,自己多次尝试,问题算是解决了,在代码中加上如下几句即可。

import sys
reload(sys)
sys.setdefaultencoding('utf8')

http://docs.python.org/howto/unicode.html

上面链接是python的unicode编码API文档,英文好的同学可以看一下,加深理解。

------------------------------------------------------------------------------------------------------------------------

 

混淆了 python2 里边的 str 和 unicode 数据类型。

1.  你需要的是让编码用实际编码而不是 ascii

2.  对需要 str->unicode 的代码,可以在前边写上

import sys

reload(sys)

sys.setdefaultencoding(‘utf8′)

把 str 编码由 ascii 改为 utf8 (或 gb18030)

3.  python3 区分了 unicode str 和 byte arrary,并且默认编码不再是 ascii

 

------------------------------------------------------------------------------------------------------------------------

 

sys.defaultencoding 为文件的编码方式 


#! /usr/bin/env python 
# -*- coding: utf-8 -*- 
import sys 
reload(sys)        
  # Python2.5 初始化后会删除 sys.setdefaultencoding 这个方法,并需要重新载入 
sys.setdefaultencoding('utf-8') 

 

------------------------------------------------------------------------------------------------------------------------

 

Python 操作Mysql的中文问题

下面几个措施,保证MySQL的输出没有乱码:
1) Python文件设置编码 utf-8 (文件前面加上 #encoding=utf-8)
2) MySQL数据库charset=utf-8 
3) Python连接MySQL是加上参数 charset=utf8 
4) 设置Python的默认编码为 utf-8 (sys.setdefaultencoding(utf-8)

示例:

#encoding=utf-8  
import sys   
import MySQLdb   
  
reload(sys)   
sys.setdefaultencoding('utf-8')   
  
db=MySQLdb.connect(user='root',charset='utf8')   
cur=db.cursor()   
cur.execute('use mydb')   
cur.execute('select * from mytb limit 100')   
  
f=file("/home/user/work/tem.txt",'w')   
  
for i in cur.fetchall():   
    f.write(str(i))   
    f.write(" ")   
  
f.close()   
cur.close()