Python 3.0在2008年12月3日正式发布,在之后又经历了多个小版本(3.1,3.2,3.3……,3.9)

很多新同学在学习Python的过程中,犹豫学习Python 2还是学习Python 3而迟迟不行动,白白地浪费了大把时间,错过了升职加薪的机会,真心觉得非常遗憾。所以,我忍不住想对大家粗暴一次,给大家一个粗暴而又正确的答案:应该学习Python 2还是Python 3?都要学!

这个答案可能很出乎意料,也很容易反驳,例如:

1)Python 3 才是Python的未来

2)Python 官方都建议指直接学习Python 3

3)Python 2 只维护到2020年,不再维护了

 

熟悉Python2,重点学习Python3

罗振宇在2019年的跨年演讲《时间的朋友》中有个观点:人们都有一种受虐情节,有时候希望别人对自己粗暴一点

举了两个例子,分别是“乔布斯对待消费者的态度”和“和菜头不尊重他的饮食需求”

末了还很享受的来一句:我爱死他了,对我再粗暴一点好不好!

在Python这个圈子,就是有很多人吵着要让别人升级Python 3

很多时候用户并不关心自己用的是Python 2还是Python 3,只要能用就行。

所以,用Python 2的人并没有什么动力去升级到Python 3,但还是要顺应技术更新潮流,学习使用Python3

 

stop talking, just do it

1)学习Python前,先了解在Python 3里面已经弃用的Python 2语法,对这些部分简单了解不要花太多时间

2)使用Python 2,不要使用Python 2.7以前的版本,推荐使用 Python2.7.13

3)使用Python 3,不要使用Python 3.4以前的版本,推荐使用 Python3.7.2、Python3.9.0

4)多了解Python 2的__future__库

5)对同一份代码,不要为Python 2和Python 3分别维护分支,努力在一套代码中兼容Python 2和Python 3

不是浪费时间纠结学习Python 3还是Python 2,而是“stop talking, just do it!”

 

Python3 与 Python2 的差异总结

1、python3不再有Unicode对象,默认str就是unicode

Python2的默认编码是asscii,这也是导致Python2中经常遇到编码问题的原因之一,至于是为什么会使用asscii作为默认编码,原因在于Python这门语言诞生的时候还没出现Unicode

Python3默认采用了UTF-8作为默认编码,以后python3的代码里面不再需要在文件顶部写#coding=utf-8了。

 

2、Python3采用的是绝对路径的方式进行import

Python2中相对路径的import会导致标准库导入变得困难(想象一下,同一目录下有file.py,如何同时导入这个文件和标准库file)。Python3中这一点将被修改,如果还需要导入同一目录的文件必须使用绝对路径,否则只能使用相关导入的方式来进行导入。

Python2中存在老式类和新式类的区别,Python3统一采用新式类。新式类声明要求继承object,必须用新式类应用多重继承。

 

3、Python3使用更加严格的缩进

Python2的缩进机制中,1个tab和8个space是等价的,所以在缩进中可以同时允许tab和space在代码中共存。这种等价机制会导致部分IDE使用存在问题。Python3中1个tab只能找另外一个tab替代,因此tab和space共存会导致报错:TabError: inconsistent use of tabs and spaces in indentation.

 

4、除法变化,python3除号返回浮点数

浮点数除法操作符 / 和 // 区别

Python2:  /是整数除法,//是小数除法

Python3:  /是小数除法,//是整数除法

比如原来1/2(两个整数相除)结果是0,现在是0.5 

$ python2.7
Python 2.7.13 (v2.7.13:a06454b1afa1, Dec 17 2016, 12:39:47) 
>>> 1/2
0

$ python
Python 3.9.0 (v3.9.0:9cf6752276, Oct  5 2020, 11:29:23) 
>>> 1/2
0.5

 

5、新的字符串格式化方法format取代%

 

6、python3 彻底废弃了 long+int,统一为 int , 支持高精度整数运算

7、Python2中用raw_input,Python3中用input

 

8、异常抛出和捕捉机制区别

Python3异常类,逗号 , 改成了 as

Python2
raise IOError, "file error"   # 抛出异常
except NameError, err:        # 捕捉异常

Python3
raise IOError("file error")   # 抛出异常
except NameError as err:      # 捕捉异常

 

9、for循环中变量值区别

Python3,for循环不会修改外部相同名称变量的值

Python2,for循环会修改外部相同名称变量的值
i = 1
print ('comprehension: ', [i for i in range(5)])
print ('after: i =', i  ) # i=4

Python3,for循环不会修改外部相同名称变量的值
i = 1
print ('comprehension: ', [i for i in range(5)])
print ('after: i =', i  ) # i=1

 

10、round函数返回值区别

Python3,round函数返回int类型值

Python2,round函数返回float类型值
isinstance(round(15.5),int)     # True

Python3,round函数返回int类型值
isinstance(round(15.5),float)   # True

 

11、比较操作符区别

Python3中只有同一数据类型的对象可以比较

Python2中任意两个对象都可以比较
11 < 'test'     # True

Python3中只有同一数据类型的对象可以比较
11 < 'test'     # TypeError: unorderable types: int() < str()

 

12、StringIO

Python3中需要这样:

from io import StringIO

Python2 还是:

from StringIO import StringIO

 

 

Python3 改进

1、类型注解(type hint),帮助IDE实现类型检查

2、优化的super(),方便直接调用父类函数

3、高级解包操作。a,b,*rest = range(10)

4、Keyword only arguments,限定关键字参数

5、Chained exceptions,python3重新抛出异常不会丢失栈信息

6、一切返回迭代器range, zip, map, dict.values, etc, are all iterators。

 

Python3 新增

1、yield from链接子生成器

2、asyncio内置库,async/await原生协程支持异步编程

3、新的内置库enum, mock, asyncio, ipaddress, concurrent.futures等

4、生成的pyc文件统一放到__pycache__

5、一些内置库的修改。urllib,selector等

6、性能优化等。。。

所有在Python3.X中增加的新特性在Python2中都不支持,这些新特性的说明在官网中有详细的说明:

 https://docs.python.org/3.1/whatsnew/

 https://docs.python.org/3.2/whatsnew/3.2.html

 https://docs.python.org/3.3/whatsnew/3.0.html

 https://docs.python.org/3.4/whatsnew/3.4.html

 https://docs.python.org/3.5/whatsnew/3.5.html

 https://docs.python.org/3.6/whatsnew/3.6.html

国内有对这些特性中的重要点进行介绍的博文,可以作为参考

Python 3.X简史——记录3.0之后的重要更新

 

Python3 废弃类

  1. print语句被python3废弃,统一使用print函数

  2. exec语句被python3废弃,统一使用exec函数

  3. execfile语句被Python3废弃,推荐使用exec(open("./filename").read())

  4. 不相等操作符"<>"被Python3废弃,统一使用"!="

  5. long整数类型被Python3废弃,统一使用int

  6. xrange函数被Python3废弃,统一使用range,Python3中range的机制也进行修改并提高了大数据集生成效率

  7. Python3中这些方法再不再返回list对象:dictionary关联的keys()、values()、items(),zip(),map(),filter(),但是可以通过list强行转换:

    mydict={"a":1,"b":2,"c":3}
    mydict.keys()  #<built-in method keys of dict object at 0x000000000040B4C8>
    list(mydict.keys()) #['a', 'c', 'b']
  8. 迭代器iterator的next()函数被Python3废弃,统一使用next(iterator)

  9. raw_input函数被Python3废弃,统一使用input函数

  10. 字典变量的has_key函数被Python废弃,统一使用in关键词

  11. file函数被Python3废弃,统一使用open来处理文件,可以通过io.IOBase检查文件类型

  12. apply函数被Python3废弃

  13. 异常StandardError 被Python3废弃,统一使用Exception

 

Python 第三方工具包

在pip官方下载源 pypihttps://pypi.org) 搜索Python2.7和Python3.5的第三方工具包数可以发现,Python2.7版本对应的第三方工具类目数量是28523,Python3.5版本的数量是12457,这两个版本在第三方工具包支持数量差距相当大。

https://pypi.python.org/pypi?:action=browse&c=532

https://pypi.python.org/pypi?:action=browse&c=607

我们从数据分析的应用角度列举了常见实用的第三方工具包(如下表),并分析这些工具包在Python2.7和Python3.5的支持情况:

分类 工具名 用途
数据收集 scrapy 网页采集,爬虫
数据收集 scrapy-redis 分布式爬虫
数据收集 selenium web测试,仿真浏览器
数据处理 beautifulsoup 网页解释库,提供lxml的支持
数据处理 lxml xml解释库
数据处理 xlrd excel文件读取
数据处理 xlwt excel文件写入
数据处理 xlutils excel文件简单格式修改
数据处理 pywin32 excel文件的读取写入及复杂格式定制
数据处理 Python-docx Word文件的读取写入
数据分析 numpy 基于矩阵的数学计算库
数据分析 pandas 基于表格的统计分析库
数据分析 scipy 科学计算库,支持高阶抽象和复杂模型
数据分析 statsmodels 统计建模和计量经济学工具包
数据分析 scikit-learn 机器学习工具库
数据分析 gensim 自然语言处理工具库
数据分析 jieba 中文分词工具库
数据存储 MySQL-python mysql的读写接口库
数据存储 mysqlclient mysql的读写接口库
数据存储 SQLAlchemy 数据库的ORM封装
数据存储 pymssql sql server读写接口库
数据存储 redis redis的读写接口
数据存储 PyMongo mongodb的读写接口
数据呈现 matplotlib 流行的数据可视化库
数据呈现 seaborn 美观的数据可是湖库,基于matplotlib
工具辅助 jupyter 基于web的python IDE,常用于数据分析
工具辅助 chardet 字符检查工具
工具辅助 ConfigParser 配置文件读写支持
工具辅助 requests HTTP库,用于网络访问

 

工具安装问题

1、Windows环境

Python2 无法安装mysqlclient。Python3 无法安装MySQL-python、 flup、functools32、Gooey、Pywin32、 webencodings。

matplotlib在python3环境中安装报错:The following required packages can not be built:freetype, png。需要手动下载安装源码包安装解决。

scrapy在python3环境中安装报错,需安装VC++2015安装包: http://landinghub.visualstudio.com/visual-cpp-build-tools

scipy在Python3环境中安装报错,numpy.distutils.system_info.NotFoundError,需要自己手工下载对应的安装包,依赖numpy,pandas必须严格根据python版本、操作系统、64位与否。

运行matplotlib后发现基础包numpy+mkl安装失败,需要自己下载,国内暂无下载源

2、Centos环境下

python2无法安装mysql-python和mysqlclient包,报错:EnvironmentError: mysql_config not found,解决方案是安装mysql-devel包解决。使用matplotlib报错:no module named _tkinter,安装Tkinter、tk-devel、tc-devel解决。

pywin32也无法在centos环境下安装。

 

工具测试结果

解决上述的安装问题后,编写了测试脚本(附录)运行上述工具包的简单案例,测试结果均通过,表明上述第三方工具包安装成功后在Windows和Centos环境下均可以成功运行。

 

Python 2 和 Python 3 有哪些主要区别

Python2和Python3的区别,以及为什么选Python3的原因

 

 

参考推荐:

Python3 字符串格式化的使用

Python中获取系统环境变量

Python 爬虫工具学习汇总

Python 探索股票市场数据

Python 判断内网ip的实现方法

Python 基础语法图谱

Python 打印版本号

Python 发送 email 的三种方式

Python 判断是否为整数、小数的几种方法

Python 替换字符串的正则匹配 re.sub 正确用法

Python 里 subprocess.Popen() 简单用法

Python 运用多态的面向对象开发浅析

Python 面向对象的多态与多态性

Python 装饰器之简易教程

Python 类的继承和多态

Python3.5 + Selenium3.4 + Webdriver 自动化测试

Python + Selenium + Firefox 使用代理 auth 的用户名密码授权

Python + Selenium + Chrome 使用代理 auth 的用户名密码授权