迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > Python >

如何从 Python 中的字符串中删除重音符号

作者:迹忆客 最近更新:2023/02/03 浏览次数:

使用 unidecode 包从字符串中删除重音符号,例如 str_without_accents = unidecode(str_with_accents)unidecode() 函数将通过将字符替换为可以安全编码为 ASCII 的字符来删除字符串中的所有重音符号。

我们应该做的第一件事是安装 unidecode 包。

$ pip install Unidecode

现在我们可以导入并使用 unidecode 功能。

from unidecode import unidecode

str_with_accents = 'ÂéüÒÑ'

str_without_accents = unidecode(str_with_accents)

print(str_without_accents)  # 👉️ 'AeuON'

unidecode 函数接受一个可能包含非 ASCII 字符的字符串,并返回一个可以安全地编码为 ASCII 的字符串。

如果我们的字符串包含 unidecode 无法转换为 ASCII 兼容字符的字符,该函数将用空字符串替换它们。

from unidecode import unidecode

str_with_accents = 'ÂéüÒÑ\ue123'

str_without_accents = unidecode(str_with_accents)

print(str_without_accents)  # 👉️ 'AeuON'

请注意\ue123 字符无法转换为 ASCII 兼容字符并从字符串中删除。

如果我们想在 unidecode 函数遇到无法转换为 ASCII 兼容字符的字符时引发错误,请将 errors 关键字参数设置为 strict

from unidecode import unidecode

str_with_accents = 'ÂéüÒÑ\ue123'

# ⛔️ unidecode.UnidecodeError: no replacement found for character '\ue123' in position 5
str_without_accents = unidecode(str_with_accents, errors='strict')

unidecode.UnidecodeError: no replacement found for character

unidecode 函数找不到 \ue123 字符的替代品,因此它引发了一个错误。

unidecode 包公开了一个 UnidecodeError 对象,它使我们能够访问无法翻译的字符的索引。

from unidecode import unidecode, UnidecodeError

str_with_accents = 'ÂéüÒÑ\ue123'

# ⛔️ unidecode.UnidecodeError: no replacement found for character '\ue123' in position 5
try:
    str_without_accents = unidecode(str_with_accents, errors='strict')
except UnidecodeError as e:
    print(e.index)  # 👉️ 5

索引 5 处的字符引发了错误。

我们还可以将 errors 关键字参数设置为 replace 以替换无法用另一个字符串翻译的字符。

from unidecode import unidecode

str_with_accents = 'ÂéüÒÑ\ue123'

str_without_accents = unidecode(
    str_with_accents, errors='replace', replace_str='?'
)
print(str_without_accents)  # 👉️ 'AeuON?'

replace_str 关键字参数用于指定替换字符串。

如果要保留无法转换为 ASCII 兼容字符的字符,可以使用 preserve 关键字参数。

from unidecode import unidecode

str_with_accents = 'ÂéüÒÑ\ue123'

str_without_accents = unidecode(
    str_with_accents,
    errors='preserve',
)
print(str_without_accents)  # 👉️ 'AeuON'

但是,如果将 errors 设置为 preserve ,则 unidecode 函数不会生成 ASCII 兼容的字符串。

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

Python for 循环中的下一项

发布时间:2023/04/26 浏览次数:179 分类:Python

本文讨论了 Python 中的 for 循环以及如何通过使用 for 循环和示例来跳过列表的第一个元素。

Python While 循环用户输入

发布时间:2023/04/26 浏览次数:148 分类:Python

我们可以在 while 循环中使用 input() 函数来输入数据,直到在 Python 中满足某个条件。

Python 中的整数规划

发布时间:2023/04/26 浏览次数:193 分类:Python

本文介绍了整数规划和可用于解决混合整数规划问题的 Python 工具。

在 Python 中将整数转换为罗马数字

发布时间:2023/04/26 浏览次数:87 分类:Python

本篇文章将介绍在 Python 中将整数转换为罗马数字。以下是一个 Python 程序的实现,它将给定的整数转换为其等效的罗马数字。

在 Python 中将罗马数字转换为整数

发布时间:2023/04/26 浏览次数:144 分类:Python

本文讨论如何在 Python 中将罗马数字转换为整数。 我们将使用 Python if 语句来执行此操作。 我们还将探讨在 Python 中将罗马数字更改为整数的更多方法。

在 Python 中读取 gzip 文件

发布时间:2023/04/26 浏览次数:70 分类:Python

本篇文章强调了压缩文件的重要性,并演示了如何在 Python 中使用 gzip 进行压缩和解压缩。

在 Python 中锁定文件

发布时间:2023/04/26 浏览次数:141 分类:Python

本文解释了为什么在 Python 中锁定文件很重要。 这讨论了当两个进程在没有锁的情况下与共享资源交互时会发生什么的示例,为什么在放置锁之前知道文件状态很重要,等等

在 Python 中将 PDF 转换为文本

发布时间:2023/04/26 浏览次数:196 分类:Python

在本教程中,我们将学习如何使用 Python 使用 PyPDF2、Aspose 和 PDFminer 将 PDF 文档转换为文本文件。

在 Python 中创建临时文件

发布时间:2023/04/26 浏览次数:53 分类:Python

本文讲解了tempfile库函数的四个子函数:TemporaryFile、NamedTemporaryFile、mkstemp、TemporaryDirectory。 每个部分都提供了适当的程序,以简化对概念的理解。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便