Python 中将字符串拆分为单词和标点符号
使用 re.findall()
方法将字符串拆分为单词和标点符号,例如 result = re.findall(r[\w'\"]+|[,.!?]", my_str)
。findall()
方法将根据空白字符和标点符号拆分字符串,并返回匹配列表 。
import re
my_str = """One, "Two" Three. Four! Five? I'm """
result = re.findall(r"[\w'\"]+|[,.!?]", my_str)
# 👇️ ['One', ',', '"Two"', 'Three', '.', 'Four', '!', 'Five', '?', "I'm"]
print(result)
re.findall
方法将一个模式和一个字符串作为参数,并返回一个字符串列表,其中包含字符串中该模式的所有非重叠匹配项。
方括号 []
用于表示一组字符。
\w
字符匹配任何语言中可以作为单词一部分的大多数字符,以及数字和下划线。
如果设置了 ASCII 标志,\w
字符匹配 **[a-zA-Z0-9_]**。
我们的字符集还包括单引号和双引号。
import re
my_str = """One, "Two" Three. Four! Five? I'm """
result = re.findall(r"[\w'\"]+|[,.!?]", my_str)
# 👇️ ['One', ',', '"Two"', 'Three', '.', 'Four', '!', 'Five', '?', "I'm"]
print(result)
如果要从结果中排除单引号或双引号,请删除方括号之间的 '
和 \"
字符。
+
与前面的字符匹配 1 次或多次。
换句话说,不管单词由多少个字符组成,只要它只包含字符、数字、下划线、单引号和双引号,我们就认为它是一个匹配。 管道 | 字符是一个或。 匹配 A 或 B。
第二组方括号匹配标点符号 - 逗号、点、感叹号和问号。
我们可以在方括号之间添加任何其他标点符号,例如 一个冒号 :
,一个分号 ;
,方括号或圆括号。
就其整体而言,匹配是 - 一个或多个字符、数字、下划线、引号或方括号之间的任何标点符号。
我们可以根据用例调整正则表达式。 文档的这一部分包含有关每个特殊字符的作用的信息。
这是完整的代码片段。
import re
my_str = """One, "Two" Three. Four! Five? I'm """
# result = re.findall(r"[\w'\"]+|[,.!?]", my_str)
result = re.findall(r"[\w]+|[,.!?]", my_str)
# 👇️ ['One', ',', '"Two"', 'Three', '.', 'Four', '!', 'Five', '?', "I'm"]
print(result)
相关文章
Python for 循环中的下一项
发布时间:2023/04/26 浏览次数:179 分类:Python
-
本文讨论了 Python 中的 for 循环以及如何通过使用 for 循环和示例来跳过列表的第一个元素。
Python While 循环用户输入
发布时间:2023/04/26 浏览次数:148 分类:Python
-
我们可以在 while 循环中使用 input() 函数来输入数据,直到在 Python 中满足某个条件。
在 Python 中将整数转换为罗马数字
发布时间:2023/04/26 浏览次数:87 分类:Python
-
本篇文章将介绍在 Python 中将整数转换为罗马数字。以下是一个 Python 程序的实现,它将给定的整数转换为其等效的罗马数字。
在 Python 中将罗马数字转换为整数
发布时间:2023/04/26 浏览次数:144 分类:Python
-
本文讨论如何在 Python 中将罗马数字转换为整数。 我们将使用 Python if 语句来执行此操作。 我们还将探讨在 Python 中将罗马数字更改为整数的更多方法。
在 Python 中读取 gzip 文件
发布时间:2023/04/26 浏览次数:70 分类:Python
-
本篇文章强调了压缩文件的重要性,并演示了如何在 Python 中使用 gzip 进行压缩和解压缩。
在 Python 中锁定文件
发布时间:2023/04/26 浏览次数:141 分类:Python
-
本文解释了为什么在 Python 中锁定文件很重要。 这讨论了当两个进程在没有锁的情况下与共享资源交互时会发生什么的示例,为什么在放置锁之前知道文件状态很重要,等等
在 Python 中将 PDF 转换为文本
发布时间:2023/04/26 浏览次数:196 分类:Python
-
在本教程中,我们将学习如何使用 Python 使用 PyPDF2、Aspose 和 PDFminer 将 PDF 文档转换为文本文件。
在 Python 中创建临时文件
发布时间:2023/04/26 浏览次数:53 分类:Python
-
本文讲解了tempfile库函数的四个子函数:TemporaryFile、NamedTemporaryFile、mkstemp、TemporaryDirectory。 每个部分都提供了适当的程序,以简化对概念的理解。