Python中不区分大小写的字符串比较
将两个字符串都转换为小写以执行不区分大小写的字符串比较,例如 if string1.lower() == string2.lower():
。 通过将两个字符串转换为相同的大小写,我们执行不区分大小写的比较。
string1 = 'Jiyik'
string2 = 'JIYIK'
# ✅ using str.lower()
if string1.lower() == string2.lower():
# 👇️ this runs
print('The strings are equal when case is ignored ✅')
else:
print('The strings are NOT equal when case is ignored ✅')
# ------------------------------------------------------------
# ✅ using str.casefold()
if string1.casefold() == string2.casefold():
# 👇️ this runs
print('The strings are equal when case is ignored ✅')
else:
print('The strings are NOT equal when case is ignored ✅')
第一个示例使用 str.lower()
方法执行不区分大小写的字符串比较。
str.lower()
方法返回字符串的副本,其中所有大小写字符都转换为小写。
string1 = 'Jiyik'
string2 = 'JIYIK'
if string1.lower() == string2.lower():
# 👇️ this runs
print('The strings are equal when case is ignored ✅')
else:
print('The strings are NOT equal when case is ignored ✅')
该方法不会更改原始字符串,而是返回一个新字符串。 字符串在 Python 中是不可变的。
通过将两个字符串转换为相同的大小写(小写或大写),我们可以执行不区分大小写的字符串比较。
str.lower()
方法最适合在比较 ASCII 字符串时忽略大小写。
对于非 ASCII 字符串,使用 str.casefold()
方法。
使用 str.casefold() 进行不区分大小写的字符串比较
使用 str.casefold()
方法执行不区分大小写的字符串比较,例如 if string1.casefold() == string2.casefold():
。 str.casefold()
方法删除字符串中的所有大小写区别。
string1 = 'Jiyik'
string2 = 'JIYIK'
if string1.casefold() == string2.casefold():
# 👇️ this runs
print('The strings are equal when case is ignored ✅')
else:
print('The strings are NOT equal when case is ignored ✅')
str.casefold()
方法返回字符串的大小写副本。
# 👇️ using str.casefold()
print('JIYIK'.casefold()) # 👉️ jiyik
print('ß'.casefold()) # 👉️ ss
# 👇️ using str.lower()
print('JIYIK'.lower()) # 👉️ jiyik
print('ß'.lower()) # 👉️ ß
大小写折叠类似于小写,但更具侵略性,因为它旨在删除字符串中的所有大小写区别。
请注意德语小写字母 ß 如何等于 ss。
由于字母已经是小写字母,
str.lower()
方法按原样返回字母,而str.casefold()
方法将其转换为 ss。
如果我们只比较 ASCII 字符串,则不需要使用 str.casefold()
方法。 在这种情况下,使用 str.lower()
就足够了。
如果我们要比较的字符串包含重音符号,请使用
unicodedata.normalize()
方法。
使用 unicodedata.normalize() 进行不区分大小写的字符串比较
使用 unicodedata.normalize()
方法执行不区分大小写的字符串比较。 unicodedata.noramlize()
方法将返回字符串的正常形式,因此带重音的等效字符被认为是相等的。
import unicodedata
def caseless_compare(str1, str2):
return (unicodedata.normalize('NFKD', str1) ==
unicodedata.normalize('NFKD', str2))
string1 = 'dž'
string2 = 'dž'
print(string1 == string2) # 👉️ False
print(string1.lower() == string2.lower()) # 👉️ False
print(string1.casefold() == string2.casefold()) # 👉️ False
print(caseless_compare(string1, string2)) # 👉️ True
我们正在比较的字符串包含重音符号。 它们代表相同的字符(或字符序列),但具有不同的视觉外观。
str.lower()
和str.casefold()
方法在比较字符串方面做得不好,所以我们不得不使用unicodedata.normalize()
方法。
unicodedata.normalize()
方法返回提供的 Unicode 字符串的正常形式。
我们使用 NFKD 作为表单参数。 范式 KD (NFKD) 应用兼容性分解。 换句话说,它将所有字符替换为它们的等价物。
我们对示例中的两个字符串进行了规范化,以执行不区分大小写的字符串比较。
仅当我们的字符串可能包含不一致的重音字符时,才需要这种方法。
我们应该选择哪种方法取决于您的用例。
如果我们只使用 ASCII 字符串,则使用 str.lower()
方法就足够了。
相关文章
Python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:Python
-
Python Pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
在 Python 中将 Pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:Python
-
了解如何在 Python 中将 Pandas 系列日期时间转换为字符串
在 Python Pandas 中使用 str.split 将字符串拆分为两个列表列
发布时间:2024/04/24 浏览次数:1124 分类:Python
-
本教程介绍如何使用 pandas str.split() 函数将字符串拆分为两个列表列。
在 Pandas 中将 Timedelta 转换为 Int
发布时间:2024/04/23 浏览次数:231 分类:Python
-
可以使用 Pandas 中的 dt 属性将 timedelta 转换为整数。
Python 中的 Pandas 插入方法
发布时间:2024/04/23 浏览次数:112 分类:Python
-
本教程介绍了如何在 Pandas DataFrame 中使用 insert 方法在 DataFrame 中插入一列。
使用 Python 将 Pandas DataFrame 保存为 HTML
发布时间:2024/04/21 浏览次数:106 分类:Python
-
本教程演示如何将 Pandas DataFrame 转换为 Python 中的 HTML 表格。
如何将 Python 字典转换为 Pandas DataFrame
发布时间:2024/04/20 浏览次数:73 分类:Python
-
本教程演示如何将 python 字典转换为 Pandas DataFrame,例如使用 Pandas DataFrame 构造函数或 from_dict 方法。
如何在 Pandas 中将 DataFrame 列转换为日期时间
发布时间:2024/04/20 浏览次数:101 分类:Python
-
本文介绍如何将 Pandas DataFrame 列转换为 Python 日期时间。