当前位置:网站首页>《Python Cookbook 3rd》笔记(2.1):使用多个界定符分割字符串
《Python Cookbook 3rd》笔记(2.1):使用多个界定符分割字符串
2020-11-09 23:53:00 【巨輪】
使用多个界定符分割字符串
问题
你需要将一个字符串分割为多个字段,但是分隔符 (还有周围的空格) 并不是固定的。
解法
string 对象的 split() 方法只适应于非常简单的字符串分割情形,它并不允许有多个分隔符或者是分隔符周围不确定的空格。当你需要更加灵活的切割字符串的时候,最好使用 re.split() 方法:
>>> line = 'asdf fjdk; afed, fjek,asdf, foo'
>>> import re
>>> re.split(r'[;,\s]\s*', line)
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
讨论
函数 re.split() 是非常实用的,因为它允许你为分隔符指定多个正则模式。比如,在上面的例子中,分隔符可以是逗号,分号或者是空格,并且后面紧跟着任意个的空格。只要这个模式被找到,那么匹配的分隔符两边的实体都会被当成是结果中的元素返回。返回结果为一个字段列表,这个跟 str.split() 返回值类型是一样的。
当你使用 re.split() 函数时候,需要特别注意的是正则表达式中是否包含一个括号捕获分组。如果使用了捕获分组,那么被匹配的文本也将出现在结果列表中。比如,观察一下这段代码运行后的结果:
>>> fields = re.split(r'(;j,j\s)\s*', line)
>>> fields
['asdf', ' ', 'fjdk', ';', 'afed', ',', 'fjek', ',', 'asdf', ',', 'foo']
>>>
获取分割字符在某些情况下也是有用的。比如,你可能想保留分割字符串,用来在后面重新构造一个新的输出字符串:
>>> values = fields[::2]
>>> delimiters = fields[1::2] + ['']
>>> values
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
>>> delimiters
[' ', ';', ',', ',', ',', '']
>>> # Reform the line using the same delimiters
>>> ''.join(v+d for v,d in zip(values, delimiters))
'asdf fjdk;afed,fjek,asdf,foo'
>>>
如果你不想保留分割字符串到结果列表中去,但仍然需要使用到括号来分组正则表达式的话,确保你的分组是非捕获分组,形如 (?:...) 。比如:
>>> re.split(r'(?:,j;j\s)\s*', line)
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
>>>
版权声明
本文为[巨輪]所创,转载请带上原文链接,感谢
https://my.oschina.net/jallenkwong/blog/4710362
边栏推荐
- Python中[:]与[::]的用法
- Algorithm template arrangement (1)
- js label语法跳出多重循环
- 痞子衡嵌入式:RT-UFL - 一个适用全平台i.MXRT的超级下载算法设计
- leetcode之最后一个单词的长度
- DB engines database ranking in November: PostgreSQL holds the top spot in the same period
- Common concepts and points for attention of CUDA
- 2018中国云厂商TOP5:阿里云、腾讯云、AWS、电信、联通 ...
- 做个别人家的网页
- So what should investors do with the current market? Now a new investment outlet is coming!
猜你喜欢
Error running app:Default Activity not found 解决方法
win7+vs2015+cuda10.2配置TensorRT7.0
消防知识线上答题活动小程序复盘
那么当下的行情投资者该怎么办呢? 现在新的投资风口来了!
Coding style: SSM environment in MVC mode, code hierarchical management
Exception: invalid or unexpected token
快来学习!个性化推荐系统开发指南(附网盘链接)
【CentOS7操作系统安全加固系列】第(2)篇
Python prompt attributeerror or depreciation warning: This module was degraded solution
Error running app: default activity not found solution
随机推荐
nodejs篇-手写koa中间件
CUDA_ Shared memory, memory access mechanism, access optimization
2020-11-09:谈谈布隆过滤器和布谷鸟过滤器的相同点和不同点?
PL/SQL Developer临时用户和新手的功能指南
C/C++编程笔记:C语言开发坦克大战!纪念我们逝去的小霸王游戏
推动中国制造升级,汽车装配车间生产流水线3D可视化
win7+vs2015+cuda10.2配置TensorRT7.0
C++ exception implementation mechanism
Can public IP address and SSL certificate improve SEO?
2018中国云厂商TOP5:阿里云、腾讯云、AWS、电信、联通 ...
Technical point 5: XML language
初级工程师如何在职场生存
mongodb内核源码实现、性能调优、最佳运维实践系列-command命令处理模块源码实现一
2018中国云厂商TOP5:阿里云、腾讯云、AWS、电信、联通 ...
Unity使用transform.Rotate进行三维旋转角度出现偏差
CUDA_ Memory model
异常:Invalid or unexpected token
The kth smallest node in the print binary search tree of offer
白山云科技入选2020中国互联网企业百强
Hengxun Technology: the way to deal with server downtime