Python 中将字符串拆分为单词和标点符号
使用 re.findall()
方法将字符串拆分为单词和标点符号,例如 result = re.findall(r[\w'\"]+|[,.!?]", my_str)
。findall()
方法将根据空白字符和标点符号拆分字符串,并返回匹配列表 。
import re
my_str = """One, "Two" Three. Four! Five? I'm """
result = re.findall(r"[\w'\"]+|[,.!?]", my_str)
# 👇️ ['One', ',', '"Two"', 'Three', '.', 'Four', '!', 'Five', '?', "I'm"]
print(result)
re.findall
方法将一个模式和一个字符串作为参数,并返回一个字符串列表,其中包含字符串中该模式的所有非重叠匹配项。
方括号 []
用于表示一组字符。
\w
字符匹配任何语言中可以作为单词一部分的大多数字符,以及数字和下划线。
如果设置了 ASCII 标志,\w
字符匹配 **[a-zA-Z0-9_]**。
我们的字符集还包括单引号和双引号。
import re
my_str = """One, "Two" Three. Four! Five? I'm """
result = re.findall(r"[\w'\"]+|[,.!?]", my_str)
# 👇️ ['One', ',', '"Two"', 'Three', '.', 'Four', '!', 'Five', '?', "I'm"]
print(result)
如果要从结果中排除单引号或双引号,请删除方括号之间的 '
和 \"
字符。
+
与前面的字符匹配 1 次或多次。
换句话说,不管单词由多少个字符组成,只要它只包含字符、数字、下划线、单引号和双引号,我们就认为它是一个匹配。 管道 | 字符是一个或。 匹配 A 或 B。
第二组方括号匹配标点符号 - 逗号、点、感叹号和问号。
我们可以在方括号之间添加任何其他标点符号,例如 一个冒号 :
,一个分号 ;
,方括号或圆括号。
就其整体而言,匹配是 - 一个或多个字符、数字、下划线、引号或方括号之间的任何标点符号。
我们可以根据用例调整正则表达式。 文档的这一部分包含有关每个特殊字符的作用的信息。
这是完整的代码片段。
import re
my_str = """One, "Two" Three. Four! Five? I'm """
# result = re.findall(r"[\w'\"]+|[,.!?]", my_str)
result = re.findall(r"[\w]+|[,.!?]", my_str)
# 👇️ ['One', ',', '"Two"', 'Three', '.', 'Four', '!', 'Five', '?', "I'm"]
print(result)
相关文章
Python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:Python
-
Python Pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
在 Python 中将 Pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:Python
-
了解如何在 Python 中将 Pandas 系列日期时间转换为字符串
在 Python Pandas 中使用 str.split 将字符串拆分为两个列表列
发布时间:2024/04/24 浏览次数:1124 分类:Python
-
本教程介绍如何使用 pandas str.split() 函数将字符串拆分为两个列表列。
在 Pandas 中将 Timedelta 转换为 Int
发布时间:2024/04/23 浏览次数:231 分类:Python
-
可以使用 Pandas 中的 dt 属性将 timedelta 转换为整数。
Python 中的 Pandas 插入方法
发布时间:2024/04/23 浏览次数:112 分类:Python
-
本教程介绍了如何在 Pandas DataFrame 中使用 insert 方法在 DataFrame 中插入一列。
使用 Python 将 Pandas DataFrame 保存为 HTML
发布时间:2024/04/21 浏览次数:106 分类:Python
-
本教程演示如何将 Pandas DataFrame 转换为 Python 中的 HTML 表格。
如何将 Python 字典转换为 Pandas DataFrame
发布时间:2024/04/20 浏览次数:73 分类:Python
-
本教程演示如何将 python 字典转换为 Pandas DataFrame,例如使用 Pandas DataFrame 构造函数或 from_dict 方法。
如何在 Pandas 中将 DataFrame 列转换为日期时间
发布时间:2024/04/20 浏览次数:101 分类:Python
-
本文介绍如何将 Pandas DataFrame 列转换为 Python 日期时间。