翻译 | 更快的Python(二)
文章目录
更快的Python(Python Faster Way)使用代码示例来说明如何书写Python代码能带来更高的性能。本文对代码进行了讲解,从性能和可读性等角度来选择出最适合的写法。
例子11:字符串连接
- 最差/最优时间比:1.15
- 使用建议:一次性连接多个(3个以上)的字符串的时候,使用join,其他情况使用加号或f-string。
- 说明:又是一个字符串连接的问题,不过这个例子举的不好,join适用的场景是一次连接多个字符串,会比加号连接多个字符串要快很多(加号相当于一个一个连接)。
例子12:数字的格式化
- 最差/最优时间比:1.29
- 使用建议:需要复杂格式,推荐使用format方法;将数字转换为字符串,直接使用str方法。
- 说明:将数字转为字符串,使用str方法要快于format方法,因为format方法支持在转换过程中增加规则,例如将数字转为货币形式(每三位加一个逗号分隔符)。
例子13:获取内置列表类型的长度
- 最差/最优时间比:1.20
- 使用建议:使用len()方法。
- 说明:当调用len()方法时,系统实际上是调用了对象内置的__len__方法,从这个层面理解,直接调用__len__应该比len()方法更快。但是当len()内置的列表方法时,Python解释器做了优化,直接返回了列表对象中存储长度信息的变量,并不会调用__len__。
例子14:整数类型的运算
- 最差/最优时间比:2.63
- 使用建议:不要直接调用__add__等魔术方法。
- 说明:对于整数类型,调用魔术方法完成运算的速度远远慢于直接使用运算符,使用运算符时,Python解释器直接调用C实现的operaotr包中的运算方法,所以速度很快;而使用调用魔术方法,在Python层面多出了调用__add__等魔术方法的额外操作。
例子15:自定义类型的运算符重载
- 最差/最优时间比:1.06
- 使用建议:不要直接调用__add__等魔术方法。
- 说明:对于重载了运算符的对象,没有对应的C实现运算方法,所以直接直接调用魔术方法速度会更快。
例子16:对range结果求和
- 最差/最优时间比:2.95
- 使用建议:推荐使用第一种。
- 说明:和第一种相比,第三种会遍历range先生成一个列表,然后将列表传给sum,速度最慢,而第一种直接传递迭代器给sum,省去了遍历生成列表的过程;第二种和第一种相比则是在Python层面实现了求和,而sum是C层面实现的求和,所以也没有第一种块。
例子17:for循环和表达式构建列表的区别
- 最差/最优时间比:2.05
- 使用建议:推荐使用表达式构建。
- 说明:两种方式看上去逻辑一样,都是把range迭代器遍历,生成一个列表,但是表达式是在字节码层面构建了一个循环来生成,而第二种则是在Python层面创建列表,并不断Append,性能上要差于第一种。
例子18:for循环和表达式构建字典的区别
- 最差/最优时间比:1.49
- 使用建议:推荐使用表达式。
- 说明:dict的update方法适用于合并两个字典的情况,也就是说可以一次合并多个key,所以相比于直接访问key速度要慢;根据图中的测试,在100这个量级上,表达式生成的速度要慢一些,但是在更大的量级上,表达式的优势就体现出来了,并且更加Pythonic。首先表达式方法是在字节码层面生成循环的,所以理论上比Python层面生成循环构建字典要快的,那么为什么在小量级的场景下,字节码反倒没有优势呢?根据dis出的字节码可以看到,表达式构建首先会MAKE_FUNCTION然后再CALL_FUNCTION,这里会有一些基本的消耗,量级小的时候,这些基本消耗占比高,量级越大,这些基本消耗所占比例就越低,表达式方法的优势也就越明显。
例子19:for循环和表达式构建字典的区别
- 最差/最优时间比:2.89
- 使用建议:推荐使用表达式构建。
- 说明:理由同上一个例子。
例子20:转换为bool值
- 最差/最优时间比:N/A
- 使用建议:根据具体情况选择。
- 说明:这个比较似乎没有什么好说的,时间的区别主要原因是构建a对象的成本不同。