你所不知道的Python | 字符串格式化的演进之路
字符串格式化对于每个语言来说都是一个非常基础和常用的功能,学习Python的同学大概都知道可以用%语法来格式化字符串。然而为了让我们更方便的使用这个常用功能,语言本身也在对字符串格式化方法进行迭代。
Python 2.6以前:%操作符
在Python 2.6出现之前,字符串迭代只有一种方法,就是%(也是取模)操作符,%操作符支持unicode和str类型的Python字符串,效果和C语言中的sprintf()方法相似,下面是一个使用%格式化字符串的例子:
1 | print("I'm %s. I'm %d year old" % ('Tom', 27)) |
%符号前面使用一个字符串作为模板,模板中有标记格式的占位符号,%后面是一个tuple或者dict,用来传递需要格式化的值。占位符控制着显示的格式,下面列表展示了占位符的种类:
占位符 | 内容 |
---|---|
%d | 十进制整数 |
%i | 十进制整数 |
%o | 八进制整数 |
%u | 无符号整数 |
%x | 无符号十六进制(小写) |
%X | 无符号十六进制(大写) |
%e | 浮点型(科学记数法,小写) |
%E | 浮点型(科学记数法,大写) |
%f | 浮点数 |
%F | 浮点数 |
%g | 浮点型,如果小数位数超过4位,使用科学记数法表示(小写) |
%G | 浮点型,如果小数位数超过4位,使用科学记数法表示(大写) |
%c | 单个字符 |
%r | 字符串(调用repr()方法生成) |
%s | 字符串(调用str()方法生成) |
除了对数据类型的指定,%操作符还支持更复杂的格式控制:
1 | %[数据名称][对齐标志][宽度].[精度]类型 |
名称 | 内容 |
---|---|
数据名称 | 数据名称用于字典赋值,如果%符号后面传递的数组就不需要填写了 |
对齐标志 | 有+、-、0、‘ ’四种,+表示显示正负数符号,-表示左对齐,空格表示在左侧填充一个空格,0表示用0填充 |
宽度 | 表示格式化后的字符串长度,位数不足用0或空格补齐 |
精度 | 小数点后的位数 |
类型 | 数据类型(参考占位符种类) |
例如print(‘%053f’ % ‘12.34’)会输出0012.340
Python 2.6:format函数
到Python2.6时,出现了一种新的字符串格式化方式,str.format()函数,相比于%操作符,format函数使用{}和:代替了%,威力更加强大,在映射关系方面,format函数支持位置映射、关键字映射、对象属性映射、下标映射等多种方式,不仅参数可以不按顺序,也可以不用参数或者一个参数使用多次,下面通过几个例子来说明。
1 | '{1} {0}'.format('abc', 123) # 可以不按顺序进行位置映射,输出'123 abc' |
可以看到,format函数比%操作符使用起来更加方便,不需要记住太多各种占位符代表的意义,代码可读性也更高。在复杂格式控制方面,format函数也提供了更加强大的控制方式:
1 | [[填充字符]对齐方式][符号标志][#][宽度][,][.精度][类型] |
例如:
1 | '{:S^+#016,.2f}'.format(1234) |
我们以上面的代码为例,通过表格说明一下format格式控制参数:
类型 | 说明 | 示例说明 |
---|---|---|
填充字符 | 不填时默认用空格填充 | S表示用S填充 |
对齐方式 | ^表示居中对齐、<表示左对齐、>表示右对齐 | ^表示居中对齐,左右位数不足部分会用填充字符填充 |
符号标志 | +表示有符号(正数前显示+,负数前显示-),空格表示整数前加一个空格以和负数对齐 | +表示正数前显示空格 |
# | 表示是否在二进制、八进制、十六进制前显示0b、0o、0x等符号 | #表示显示进制符号,由于是十进制,所以不显示 |
宽度 | 表示输出字符串的宽度 | 16表示字符串宽度为16,不足部分会补齐 |
, | 表示使用,作为千位分隔符 | ,表示使用千位分隔符 |
精度 | 表示小数点后数字位数 | .2表示精度为2为 |
类型 | s表示字符串类型,c表示字符类型,b\o\d分别表示二八十进制,x\X表示小写和大写十六进制,e\E表示小写和大写的科学记数法,f表示浮点型 | f表示浮点型数字 |
可以看到format函数在%基础上丰富了格式控制种类,并且使输出更容易。
Python 3.6:f-string
不少使用过ES6的小伙伴会知道其中的模板字符串,采用直接在字符串中内嵌变量的方式进行字符串格式化操作,Python在3.6版本中也为我们带来了类似的功能:Formatted String Literals(字面量格式化字符串),简称f-string。
f-string就是以f’’开头的字符串,类似u’’和b’’,字符串内容和format方法中的格式一样,但是可以直接将变量带入到字符串中,可读性进一步增加,例如:
1 | amount = 1234 |
同时,f-string的性能是比%和format都有提升的,我们做一个简单的测试,分别使用%操作符、format和f-string将下面语句执行10000次:
1 | 'My name is %s and i'm %s years old.' % (name, age) |
用时结果如下:
总结
如果你的项目使用的Python版本已经提升到3.6,f-string格式化是首选方式,不仅在保持功能强大的同时语义上更容易理解,而且性能也有较大的提升。如果项目还没有提升到3.6或者使用的2.7,更建议使用format,虽然性能上没有优势,但是语义上还是比%操作符更加便于理解的,功能也更加强大。