Python 中将基本 URL 与 另一个 URL 连接起来
使用 urllib.parse 模块中的 urljoin
方法将一个基本 URL 与另一个 URL 连接起来,例如 result = urljoin(base_url, path)
。 urljoin
方法通过将基本 URL 与另一个 URL 组合来构造完整(绝对)URL。
from urllib.parse import urljoin
base_url = 'https://example.com'
path = 'images/static/cat.jpg'
result = urljoin(base_url, path)
# 👇️ https://example.com/images/static/cat.jpg
print(result)
# 👇️ /global/images/static/dog.png
print(urljoin('/global/images/', 'static/dog.png'))
如果我们有多个 URL 组件,请在将它们传递给 urljoin()
方法之前使用 posixpath 模块加入它们。
import posixpath
from urllib.parse import urljoin
base_url = 'https://example.com'
path_1 = 'images'
path_2 = 'static'
path_3 = 'cat.jpg'
path = posixpath.join(path_1, path_2, path_3)
print(path) # 👉️ 'images/static/cat.jpg'
result = urljoin(base_url, path)
# 👇️ https://example.com/images/static/cat.jpg
print(result)
urllib.parse.urljoin
方法将一个基本 URL 和另一个 URL 作为参数,并通过组合它们来构造一个完整的(绝对)URL。
我们还可以使用 urljoin
方法加入 URL 路径组件。
from urllib.parse import urljoin
# 👇️ /global/images/static/dog.png
print(urljoin('/global/images/', 'static/dog.png'))
确保我们得到的输出是我们所期望的,因为 urljoin
方法在处理不以正斜杠 / 结尾的 URL 组件时可能会有点混乱。
这是一个例子。
from urllib.parse import urljoin
# 👇️ /global/static/dog.png
print(urljoin('/global/images', 'static/dog.png'))
请注意
,该方法在加入第二个组件之前从第一个组件中剥离了图像。
当第一个组件以正斜杠结尾时,该方法的行为与预期相同。
from urllib.parse import urljoin
# 👇️ /global/images/static/dog.png
print(urljoin('/global/images/', 'static/dog.png'))
如果第二个组件以正斜杠开头,我们可能还会注意到令人困惑的行为
from urllib.parse import urljoin
# 👇️ /static/dog.png
print(urljoin('/global/images', '/static/dog.png'))
当第二个组件以正斜杠开头时,假定它从根开始。
posixpath.join()
方法更具可预测性,也可用于连接 URL 路径组件。
import posixpath
# 👇️ /global/images/static/dog.png
print(posixpath.join('/global/images', 'static/dog.png'))
# 👇️ /global/images/static/dog.png
print(posixpath.join('/global/images/', 'static/dog.png'))
# 👇️ /static/dog.png
print(posixpath.join('/global/images', '/static/dog.png'))
posixpath.join
方法也可以传递超过 2 个路径。
import posixpath
# 👇️ /global/images/static/dog.png
print(posixpath.join('/global', 'images', 'static', 'dog.png'))
相关文章
Python for 循环中的下一项
发布时间:2023/04/26 浏览次数:179 分类:Python
-
本文讨论了 Python 中的 for 循环以及如何通过使用 for 循环和示例来跳过列表的第一个元素。
Python While 循环用户输入
发布时间:2023/04/26 浏览次数:148 分类:Python
-
我们可以在 while 循环中使用 input() 函数来输入数据,直到在 Python 中满足某个条件。
在 Python 中将整数转换为罗马数字
发布时间:2023/04/26 浏览次数:87 分类:Python
-
本篇文章将介绍在 Python 中将整数转换为罗马数字。以下是一个 Python 程序的实现,它将给定的整数转换为其等效的罗马数字。
在 Python 中将罗马数字转换为整数
发布时间:2023/04/26 浏览次数:144 分类:Python
-
本文讨论如何在 Python 中将罗马数字转换为整数。 我们将使用 Python if 语句来执行此操作。 我们还将探讨在 Python 中将罗马数字更改为整数的更多方法。
在 Python 中读取 gzip 文件
发布时间:2023/04/26 浏览次数:70 分类:Python
-
本篇文章强调了压缩文件的重要性,并演示了如何在 Python 中使用 gzip 进行压缩和解压缩。
在 Python 中锁定文件
发布时间:2023/04/26 浏览次数:141 分类:Python
-
本文解释了为什么在 Python 中锁定文件很重要。 这讨论了当两个进程在没有锁的情况下与共享资源交互时会发生什么的示例,为什么在放置锁之前知道文件状态很重要,等等
在 Python 中将 PDF 转换为文本
发布时间:2023/04/26 浏览次数:196 分类:Python
-
在本教程中,我们将学习如何使用 Python 使用 PyPDF2、Aspose 和 PDFminer 将 PDF 文档转换为文本文件。
在 Python 中创建临时文件
发布时间:2023/04/26 浏览次数:53 分类:Python
-
本文讲解了tempfile库函数的四个子函数:TemporaryFile、NamedTemporaryFile、mkstemp、TemporaryDirectory。 每个部分都提供了适当的程序,以简化对概念的理解。