Pythonutf-8和utf8区别

Python 编码

python默认编码为 'ascii'，查看方法：

homer@homer-pc:~/script$ python
>>> import sys
>>> sys.getdefaultencoding()
'ascii'

python 设置自定义编码，方法如下：

homer@homer-pc:~/script$ python
>>> import sys
>>> reload(sys)
<module 'sys' (built-in)>
>>> sys.setdefaultencoding('utf-8')
>>> sys.getdefaultencoding()
'utf-8'

python 在代码中设置编码，标准格式如下：

#!/usr/bin/env python
# -*- coding:utf-8 -*-

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

utf-8 和 utf8 区别

“UTF-8”是编码格式的标准写法

PHP在Windows下英文不区分大小写，所以也可以写成“utf-8”

“UTF-8”也可以把中间的“-”省略，简写成“UTF8”，一般程序都能识别，但也有例外（如MySQL），为了严格规范，最好用标准的大写“UTF-8”

在数据库中只能使用“utf8”

例如： 在MySQL的命令模式中只能使用“utf8”，不能使用“utf-8”，也就是说在PHP程序中只能使用“set names utf8(不加小横杠)”，如果你加了“-”此行命令将不会生效，但是在PHP中header时却要加上“-”，因为IE不认识没杠的“utf8”，原因如下：

1）PHP中的header

<?php header('Content-Type: text/html; charset=UTF-8'); ?>

// 奇怪了：Content-Type用冒号，Chatset却是等号

2）静态文件使用

查看MySQL编码

1）查看数据库（database）编码格式

mysql> show create database proxy;
+----------+----------------------------------------------------------------+
| Database | Create Database |
+----------+----------------------------------------------------------------+
| proxy | CREATE DATABASE `proxy` /*!40100 DEFAULT CHARACTER SET utf8 */ |
+----------+----------------------------------------------------------------+

2）查看数据库表（table）编码格式

mysql> show create table proxy_me;
| proxy_all | CREATE TABLE `proxy_me` (
`ip` varchar(40) NOT NULL
`port` int(10) NOT NULL,
`country` varchar(100) NOT NULL,
`type` char(10) NOT NULL DEFAULT 'HTTP'
PRIMARY KEY (`ip`,`port`,`type`),
KEY `index_update_time` (`update_time`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |

总结

只有在MySQL中可以使用"utf-8"的别名"utf8"，但是在其他地方一律使用大写"UTF-8"，即

1) 在MySQL里，编码格式为 "utf8"

2) 在其它场景里，编码格式推荐使用 "UTF-8"，或小写 "utf-8"

Python 编码规范

官方参考文档： Defining Python Source Code Encodings

在Python源码的头文件中要声明编码方式，几种常见写法如下：

#coding=utf-8
#coding:utf-8
#-*- coding:utf-8 -*-

上面三种写法，怎样写才是有效地呢，优势有在哪呢？

怎么声明编码格式呢？

如果在Python中我们并没有声明别的编码方式，就是以'ascii'编码将作为默认的编码方式。

为了定义源文件的编码方式，规范做法是编码声明应当被放在这个文件的第一行或者是第二行，例如：