Python3 与 Python2 的差异总结
Python 3.0在2008年12月3日正式发布,在之后又经历了多个小版本(3.1,3.2,3.3……,3.9)
很多新同学在学习Python的过程中,犹豫学习Python 2还是学习Python 3而迟迟不行动,白白地浪费了大把时间,错过了升职加薪的机会,真心觉得非常遗憾。所以,我忍不住想对大家粗暴一次,给大家一个粗暴而又正确的答案:应该学习Python 2还是Python 3?都要学!
这个答案可能很出乎意料,也很容易反驳,例如:
1)Python 3 才是Python的未来
2)Python 官方都建议指直接学习Python 3
3)Python 2 只维护到2020年,不再维护了
熟悉Python2,重点学习Python3
罗振宇在2019年的跨年演讲《时间的朋友》中有个观点:人们都有一种受虐情节,有时候希望别人对自己粗暴一点
举了两个例子,分别是“乔布斯对待消费者的态度”和“和菜头不尊重他的饮食需求”
末了还很享受的来一句:我爱死他了,对我再粗暴一点好不好!
在Python这个圈子,就是有很多人吵着要让别人升级Python 3
很多时候用户并不关心自己用的是Python 2还是Python 3,只要能用就行。
所以,用Python 2的人并没有什么动力去升级到Python 3,但还是要顺应技术更新潮流,学习使用Python3
stop talking, just do it
1)学习Python前,先了解在Python 3里面已经弃用的Python 2语法,对这些部分简单了解不要花太多时间
2)使用Python 2,不要使用Python 2.7以前的版本,推荐使用 Python2.7.13
3)使用Python 3,不要使用Python 3.4以前的版本,推荐使用 Python3.7.2、Python3.9.0
4)多了解Python 2的__future__库
5)对同一份代码,不要为Python 2和Python 3分别维护分支,努力在一套代码中兼容Python 2和Python 3
不是浪费时间纠结学习Python 3还是Python 2,而是“stop talking, just do it!”
Python3 与 Python2 的差异总结
1、python3不再有Unicode对象,默认str就是unicode
Python2的默认编码是asscii,这也是导致Python2中经常遇到编码问题的原因之一,至于是为什么会使用asscii作为默认编码,原因在于Python这门语言诞生的时候还没出现Unicode
Python3默认采用了UTF-8作为默认编码,以后python3的代码里面不再需要在文件顶部写#coding=utf-8了。
2、Python3采用的是绝对路径的方式进行import
Python2中相对路径的import会导致标准库导入变得困难(想象一下,同一目录下有file.py,如何同时导入这个文件和标准库file)。Python3中这一点将被修改,如果还需要导入同一目录的文件必须使用绝对路径,否则只能使用相关导入的方式来进行导入。
Python2中存在老式类和新式类的区别,Python3统一采用新式类。新式类声明要求继承object,必须用新式类应用多重继承。
3、Python3使用更加严格的缩进
Python2的缩进机制中,1个tab和8个space是等价的,所以在缩进中可以同时允许tab和space在代码中共存。这种等价机制会导致部分IDE使用存在问题。Python3中1个tab只能找另外一个tab替代,因此tab和space共存会导致报错:TabError: inconsistent use of tabs and spaces in indentation.
4、除法变化,python3除号返回浮点数
浮点数除法操作符 / 和 // 区别
Python2: /是整数除法,//是小数除法
Python3: /是小数除法,//是整数除法
比如原来1/2(两个整数相除)结果是0,现在是0.5
$ python2.7 Python 2.7.13 (v2.7.13:a06454b1afa1, Dec 17 2016, 12:39:47) >>> 1/2 0 $ python Python 3.9.0 (v3.9.0:9cf6752276, Oct 5 2020, 11:29:23) >>> 1/2 0.5
5、新的字符串格式化方法format取代%
6、python3 彻底废弃了 long+int,统一为 int , 支持高精度整数运算
7、Python2中用raw_input,Python3中用input
8、异常抛出和捕捉机制区别
Python3异常类,逗号 , 改成了 as
Python2 raise IOError, "file error" # 抛出异常 except NameError, err: # 捕捉异常 Python3 raise IOError("file error") # 抛出异常 except NameError as err: # 捕捉异常
9、for循环中变量值区别
Python3,for循环不会修改外部相同名称变量的值
Python2,for循环会修改外部相同名称变量的值 i = 1 print ('comprehension: ', [i for i in range(5)]) print ('after: i =', i ) # i=4 Python3,for循环不会修改外部相同名称变量的值 i = 1 print ('comprehension: ', [i for i in range(5)]) print ('after: i =', i ) # i=1
10、round函数返回值区别
Python3,round函数返回int类型值
Python2,round函数返回float类型值 isinstance(round(15.5),int) # True Python3,round函数返回int类型值 isinstance(round(15.5),float) # True
11、比较操作符区别
Python3中只有同一数据类型的对象可以比较
Python2中任意两个对象都可以比较 11 < 'test' # True Python3中只有同一数据类型的对象可以比较 11 < 'test' # TypeError: unorderable types: int() < str()
12、StringIO
Python3中需要这样:
from io import StringIO
Python2 还是:
from StringIO import StringIO
Python3 改进
1、类型注解(type hint),帮助IDE实现类型检查
2、优化的super(),方便直接调用父类函数
3、高级解包操作。a,b,*rest = range(10)
4、Keyword only arguments,限定关键字参数
5、Chained exceptions,python3重新抛出异常不会丢失栈信息
6、一切返回迭代器range, zip, map, dict.values, etc, are all iterators。
Python3 新增
1、yield from链接子生成器
2、asyncio内置库,async/await原生协程支持异步编程
3、新的内置库enum, mock, asyncio, ipaddress, concurrent.futures等
4、生成的pyc文件统一放到__pycache__
5、一些内置库的修改。urllib,selector等
6、性能优化等。。。
所有在Python3.X中增加的新特性在Python2中都不支持,这些新特性的说明在官网中有详细的说明:
https://docs.python.org/3.1/whatsnew/
https://docs.python.org/3.2/whatsnew/3.2.html
https://docs.python.org/3.3/whatsnew/3.0.html
https://docs.python.org/3.4/whatsnew/3.4.html
https://docs.python.org/3.5/whatsnew/3.5.html
https://docs.python.org/3.6/whatsnew/3.6.html
国内有对这些特性中的重要点进行介绍的博文,可以作为参考
Python3 废弃类
-
print语句被python3废弃,统一使用print函数
-
exec语句被python3废弃,统一使用exec函数
-
execfile语句被Python3废弃,推荐使用exec(open("./filename").read())
-
不相等操作符"<>"被Python3废弃,统一使用"!="
-
long整数类型被Python3废弃,统一使用int
-
xrange函数被Python3废弃,统一使用range,Python3中range的机制也进行修改并提高了大数据集生成效率
-
Python3中这些方法再不再返回list对象:dictionary关联的keys()、values()、items(),zip(),map(),filter(),但是可以通过list强行转换:
mydict={"a":1,"b":2,"c":3} mydict.keys() #<built-in method keys of dict object at 0x000000000040B4C8> list(mydict.keys()) #['a', 'c', 'b']
-
迭代器iterator的next()函数被Python3废弃,统一使用next(iterator)
-
raw_input函数被Python3废弃,统一使用input函数
-
字典变量的has_key函数被Python废弃,统一使用in关键词
-
file函数被Python3废弃,统一使用open来处理文件,可以通过io.IOBase检查文件类型
-
apply函数被Python3废弃
-
异常StandardError 被Python3废弃,统一使用Exception
Python 第三方工具包
在pip官方下载源 pypi(https://pypi.org) 搜索Python2.7和Python3.5的第三方工具包数可以发现,Python2.7版本对应的第三方工具类目数量是28523,Python3.5版本的数量是12457,这两个版本在第三方工具包支持数量差距相当大。
https://pypi.python.org/pypi?:action=browse&c=532
https://pypi.python.org/pypi?:action=browse&c=607
我们从数据分析的应用角度列举了常见实用的第三方工具包(如下表),并分析这些工具包在Python2.7和Python3.5的支持情况:
分类 | 工具名 | 用途 |
---|---|---|
数据收集 | scrapy | 网页采集,爬虫 |
数据收集 | scrapy-redis | 分布式爬虫 |
数据收集 | selenium | web测试,仿真浏览器 |
数据处理 | beautifulsoup | 网页解释库,提供lxml的支持 |
数据处理 | lxml | xml解释库 |
数据处理 | xlrd | excel文件读取 |
数据处理 | xlwt | excel文件写入 |
数据处理 | xlutils | excel文件简单格式修改 |
数据处理 | pywin32 | excel文件的读取写入及复杂格式定制 |
数据处理 | Python-docx | Word文件的读取写入 |
数据分析 | numpy | 基于矩阵的数学计算库 |
数据分析 | pandas | 基于表格的统计分析库 |
数据分析 | scipy | 科学计算库,支持高阶抽象和复杂模型 |
数据分析 | statsmodels | 统计建模和计量经济学工具包 |
数据分析 | scikit-learn | 机器学习工具库 |
数据分析 | gensim | 自然语言处理工具库 |
数据分析 | jieba | 中文分词工具库 |
数据存储 | MySQL-python | mysql的读写接口库 |
数据存储 | mysqlclient | mysql的读写接口库 |
数据存储 | SQLAlchemy | 数据库的ORM封装 |
数据存储 | pymssql | sql server读写接口库 |
数据存储 | redis | redis的读写接口 |
数据存储 | PyMongo | mongodb的读写接口 |
数据呈现 | matplotlib | 流行的数据可视化库 |
数据呈现 | seaborn | 美观的数据可是湖库,基于matplotlib |
工具辅助 | jupyter | 基于web的python IDE,常用于数据分析 |
工具辅助 | chardet | 字符检查工具 |
工具辅助 | ConfigParser | 配置文件读写支持 |
工具辅助 | requests | HTTP库,用于网络访问 |
工具安装问题
1、Windows环境
Python2 无法安装mysqlclient。Python3 无法安装MySQL-python、 flup、functools32、Gooey、Pywin32、 webencodings。
matplotlib在python3环境中安装报错:The following required packages can not be built:freetype, png。需要手动下载安装源码包安装解决。
scrapy在python3环境中安装报错,需安装VC++2015安装包: http://landinghub.visualstudio.com/visual-cpp-build-tools
scipy在Python3环境中安装报错,numpy.distutils.system_info.NotFoundError,需要自己手工下载对应的安装包,依赖numpy,pandas必须严格根据python版本、操作系统、64位与否。
运行matplotlib后发现基础包numpy+mkl安装失败,需要自己下载,国内暂无下载源
2、Centos环境下
python2无法安装mysql-python和mysqlclient包,报错:EnvironmentError: mysql_config not found,解决方案是安装mysql-devel包解决。使用matplotlib报错:no module named _tkinter,安装Tkinter、tk-devel、tc-devel解决。
pywin32也无法在centos环境下安装。
工具测试结果
解决上述的安装问题后,编写了测试脚本(附录)运行上述工具包的简单案例,测试结果均通过,表明上述第三方工具包安装成功后在Windows和Centos环境下均可以成功运行。
Python2和Python3的区别,以及为什么选Python3的原因
参考推荐:
Python 里 subprocess.Popen() 简单用法
Python3.5 + Selenium3.4 + Webdriver 自动化测试
Python + Selenium + Firefox 使用代理 auth 的用户名密码授权
Python + Selenium + Chrome 使用代理 auth 的用户名密码授权
版权所有: 本文系米扑博客原创、转载、摘录,或修订后发表,最后更新于 2020-12-18 09:18:20
侵权处理: 本个人博客,不盈利,若侵犯了您的作品权,请联系博主删除,莫恶意,索钱财,感谢!