Python 中并发方面的差异
考虑到Python 3发布后有关异步操作和并发性的新趋势,有些人可能会认为Python刚刚引入了这些概念或功能。
许多新手可能会认为使用asyncio是执行并发和异步任务的唯一实用方法。本文将讨论如何在Python中实现并发以及其优点和缺点。
线程和多线程
线程在Python中已经存在很长时间了。因此,我们可以通过线程同时执行多个操作。
不幸的是,CPython(典型的主流Python版本)仍然使用全局解释器锁(GIL),这使得多线程应用(目前常用的实现并行处理的方法)不太理想。
Python引入了GIL来使CPython的内存处理更加可管理,以便与C(例如扩展)进行集成。
GIL是一种锁定机制,Python解释器一次只能运行一个线程。Python的字节码只能由一个线程同时执行。
示例代码:
import threading
import time
import random
def worker(num):
sec = random.randrange(1, 5)
time.sleep(sec)
print("I am thread {}, who slept for {} seconds.".format(num, sec))
for i in range(3):
t = threading.Thread(target=worker, args=(i,))
t.start()
print("Completed!")
在上面的代码中,我们定义了一个名为 worker(num)
的函数,它接收一个参数num。worker函数会随机休眠一段时间,然后打印出休眠的秒数和线程的编号。
我们使用threading.Thread类创建了三个线程对象,并通过 target 参数指定了要执行的函数 worker,并通过 args 参数传递了参数i。然后,我们使用 .start()
方法启动这些线程。
以下是上述代码的输出:
Completed!
I am thread 1, who slept for 3 seconds.
I am thread 3, who slept for 2 seconds.
I am thread 4, who slept for 4 seconds.
进程和多进程
多进程利用多个CPU。由于每个CPU并行运行,我们可以有效地同时执行多个任务。对于CPU密集型任务,多进程是您想要使用的方法。
Python引入了multiprocessing模块来实现并行处理,如果您使用过线程,它会感觉非常相似。
示例代码:
import multiprocessing
import time
import random
def worker(num):
sec = random.randrange(1, 5)
time.sleep(sec)
print("I am process {}, who slept for {} seconds.".format(num, sec))
for i in range(3):
t = multiprocessing.Process(target=worker, args=(i,))
t.start()
print("Completed")
与多线程不同,我们使用多个在CPU的不同核心上运行的进程,这使得Python脚本更快。
以下是上述代码的输出:
Completed
I am process 1, who slept for 1 seconds.
I am process 2, who slept for 2 seconds.
I am process 0, who slept for 3 seconds.
异步和asyncio
在同步操作中,任务按顺序进行,一个接一个地执行。然而,在异步操作中,任务可以完全独立于其他任务而开始执行。
异步任务可能会启动并继续运行,而执行会切换到另一个任务。另外,异步任务通常在后台执行,不会阻塞(即不会使程序等待完成)。
除了其他有价值的功能,asyncio提供了一个事件循环(event loop)。事件循环监视各种I/O事件,切换到准备就绪的任务,并暂停等待I/O的任务。
因此,我们不会浪费时间在未完成的任务上。
示例代码:
import asyncio
import datetime
import random
async def my_sleep_func():
await asyncio.sleep(random.randint(0, 5))
async def displayDate(num, loop):
endTime = loop.time() + 60.0
while True:
print("Loop: {} Time: {}".format(num, datetime.datetime.now()))
if (loop.time() + 1.0) >= endTime:
break
await my_sleep_func()
loop = asyncio.get_event_loop()
asyncio.ensure_future(displayDate(1, loop))
asyncio.ensure_future(displayDate(2, loop))
loop.run_forever()
在上面的代码片段中,我们定义了一个名为displayDate的异步函数,它接收一个数字和事件循环作为参数。该函数包含一个无限循环,在60秒后停止。在这60秒内,它重复打印时间并进行休眠。
await
函数可以等待其他异步函数完成。
我们使用 asyncio.ensure_future
函数将函数传递给事件循环。
然后,我们开始运行事件循环。当遇到await调用时,asyncio会意识到函数可能需要一些时间。当asyncio注意到暂停的函数的I/O准备就绪时,它会恢复执行。
现在,关键是在这三种并发形式中我们需要使用哪一种?我们可以考虑以下几点来帮助做决策:
- 对于CPU密集型操作,请使用多进程。
- 对于I/O密集型、快速I/O和连接数量有限的情况,请使用多线程。
- 对于I/O密集型、慢速I/O和大量连接的情况,请使用异步I/O。
- asyncio/await适用于Python 3.5及更高版本。
我们还可以参考下面的伪代码来做决策:
if io_bound:
if io_very_slow:
print("Use asyncio")
else:
print("Use multithreading")
else:
print("Use multiprocessing")
相关文章
Python 中从线程获取返回值
发布时间:2023/06/21 浏览次数:145 分类:Python
-
这篇文章首先讨论了线程的基础知识,并提供了一个在Python中启动线程的代码示例。然后,我们将讨论一个在线程中获取函数返回值的代码。
在 Python 中从文本创建 N-Grams
发布时间:2023/06/21 浏览次数:65 分类:Python
-
本文将讨论如何使用 Python 中的功能和库创建 n-gram。使用 for 循环在 Python 中从文本创建 n-gram 我们可以有效地创建一个 ngrams 函数,该函数接受文本和 n 值,并返回一个包含 n-gram 的列表。
用于 Python 的 Vim 自动完成
发布时间:2023/06/21 浏览次数:180 分类:Python
-
Vim(Vi Improved的缩写)是一款功能强大的文本编辑器,常被作为Python开发环境的首选。本文将探讨Vim及其用于Python的自动补全功能。
Python 数独求解器
发布时间:2023/06/21 浏览次数:187 分类:Python
-
本文介绍了我们如何使用 Python 来解决数独问题。 通过适应回溯算法,它可以作为一个准确的数独解算器。
Python Quine 介绍
发布时间:2023/06/21 浏览次数:167 分类:Python
-
一个Quine是一个产生其源代码作为输出的计算机程序。Quine很有趣,因为它们似乎违背了编程的目的,即根据输入生成输出。运行Python Quine
Python 复利计算器
发布时间:2023/06/21 浏览次数:172 分类:Python
-
Python是用于金融分析的优秀语言,其中之一是可以使用Python计算复利。复利是指利息不仅仅在本金(原始金额)上支付,还包括已累计的利息。本文将讨论Python复利函数。
Python中内存缓存的使用
发布时间:2023/06/21 浏览次数:171 分类:Python
-
本文将讨论准备内存缓存操作和主要的 Memcached 用法。 它还将讨论使用 Python 缓存和设置的高级模式。
Python 缓存库
发布时间:2023/06/21 浏览次数:197 分类:Python
-
Python 缓存库是必不可少的,因为它允许系统管理缓存。 缓存库可以通过提供一种访问缓存数据和管理缓存的方法来帮助提高系统性能。
管理 Python 依赖项
发布时间:2023/06/20 浏览次数:110 分类:Python
-
使用 Python 的挑战之一是管理依赖项。 在本文中,我们将讨论和学习 Python 依赖项的管理。