迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > Python >

在Python中的标点符号上拆分字符串

作者:迹忆客 最近更新:2022/11/16 浏览次数:

使用 re.split() 方法在标点符号上拆分字符串,例如 my_list = re.split('[,.!?]', my_str)re.split 方法在指定模式的所有出现处拆分字符串。

import re

my_str = """One, Two Three. Four! Five? I'm!"""

my_list = re.split('[,.!?]', my_str)

# 👇️ ['One', ' Two Three', ' Four', ' Five', " I'm", '']
print(my_list)

Python中的标点符号上拆分字符串

re.split() 方法接受一个模式和一个字符串,并在每次出现该模式时拆分字符串。

请注意 ,列表中的某些项目包含空格。 如果需要删除空格,请在正则表达式的方括号之间添加一个空格。

import re

my_str = """One, Two Three. Four! Five? I'm!"""

my_list = re.split('[ ,.!?]', my_str)

# 👇️ ['One', '', 'Two', 'Three', '', 'Four', '', 'Five', '', "I'm", '']
print(my_list)

现在我们的正则表达式也匹配空格。 如果需要从列表中删除空字符串,请使用 filter() 函数。

import re

my_str = """One, Two Three. Four! Five? I'm!"""

my_list = list(filter(None, re.split('[ ,.!?]', my_str)))

# 👇️ ['One', 'Two', 'Three', 'Four', 'Five', "I'm"]
print(my_list)

filter() 函数接受一个函数和一个可迭代对象作为参数,并从可迭代对象的元素构造一个迭代器,函数返回一个真值。

如果我们为函数参数传递 None ,则 iterable 的所有虚假元素都将被删除。

方括号 [] 用于表示一组字符。

示例中的字符集包括一个逗号 , 一个点 . 一个感叹号 ! 和一个问号

我们可以在方括号之间添加任何其他标点符号,例如 一个冒号,一个分号,方括号或圆括号。

import re

my_str = """One, Two: Three;. Four! Five? I'm!"""

my_list = list(filter(None, re.split('[ :;,.!?]', my_str)))

# 👇️ ['One', 'Two', 'Three', 'Four', 'Five', "I'm"]
print(my_list)

请注意filter() 函数返回一个过滤器对象(不是列表)。 如果我们需要将过滤器对象转换为列表,请将其传递给 list() 函数。

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

Python 中的 Pandas 插入方法

发布时间:2024/04/23 浏览次数:112 分类:Python

本教程介绍了如何在 Pandas DataFrame 中使用 insert 方法在 DataFrame 中插入一列。

Pandas 重命名多个列

发布时间:2024/04/22 浏览次数:199 分类:Python

本教程演示了如何使用 Pandas 重命名数据框中的多个列。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便