Python使用进程池管理进程和进程间通信

2024-04-06 05:05•python•阅读 1833

与线程池类似的是，如果程序需要启动多个进程，也可以使用进程池来管理进程。程序可以通过 multiprocessing 模块的 Pool() 函数创建进程池，进程池实际上是 multiprocessing.pool.Pool 类。

进程池具有如下常用方法：

1.apply(func[, args[, kwds]])：将 func 函数提交给进程池处理。其中 args 代表传给 func 的位置参数，kwds 代表传给 func 的关键字参数。该方法会被阻塞直到 func 函数执行完成。

2.apply_async(func[, args[, kwds[, callback[, error_callback]]]])：这是 apply() 方法的异步版本，该方法不会被阻塞。其中 callback 指定 func 函数完成后的回调函数，error_callback 指定 func 函数出错后的回调函数。

3.map(func, iterable[, chunksize])：类似于 Python 的 map() 全局函数，只不过此处使用新进程对 iterable 的每一个元素执行 func 函数。

4.map_async(func, iterable[, chunksize[, callback[, error_callback]]])：这是 map() 方法的异步版本，该方法不会被阻塞。其中 callback 指定 func 函数完成后的回调函数，error_callback 指定 func 函数出错后的回调函数。

5.imap(func, iterable[, chunksize])：这是 map() 方法的延迟版本。

6.imap_unordered(func, iterable[, chunksize])：功能类似于 imap() 方法，但该方法不能保证所生成的结果（包含多个元素）与原 iterable 中的元素顺序一致。

7.starmap(func, iterable[,chunksize])：功能类似于 map() 方法，但该方法要求 iterable 的元素也是 iterable 对象，程序会将每一个元素解包之后作为 func 函数的参数。

8.close()：关闭进程池。在调用该方法之后，该进程池不能再接收新任务，它会把当前进程池中的所有任务执行完成后再关闭自己。

9.terminate()：立即中止进程池。

10.join()：等待所有进程完成。

如果程序只是想将任务提交给进程池执行，则可调用 apply() 或 apply_async() 方法；

如果程序需要使用指定函数将 iterable 转换成其他 iterable，则可使用 map() 或 imap() 方法

使用 apply_async() 方法启动进程

import multiprocessing
import time
import os
def action(name='default'):
    print('(%s)进程正在执行，参数为: %s' % (os.getpid(), name))
    time.sleep(3)
if __name__ == '__main__':
    # 创建包含4条进程的进程池
    pool = multiprocessing.Pool(processes=4)
    # 将action分3次提交给进程池
    pool.apply_async(action)
    pool.apply_async(action, args=('位置参数', ))
    pool.apply_async(action, kwds={'name': '关键字参数'})
    pool.close()
    pool.join()

从上面程序可以看出，进程池同样实现了上下文管理协议，因此程序可以使用 with 子句来管理进程池，这样就可以避免程序主动关闭进程池。

使用 map() 方法来启动进程

import multiprocessing
import time
import os
# 定义一个准备作为进程任务的函数
def action(max):
    my_sum = 0
    for i in range(max):
        print('(%s)进程正在执行: %d' % (os.getpid(), i))
        my_sum += i
    return my_sum
if __name__ == '__main__':
    # 创建一个包含4条进程的进程池
    with multiprocessing.Pool(processes=4) as pool:
        # 使用进程执行map计算
        # 后面元组有3个元素，因此程序启动3条进程来执行action函数
        results = pool.map(action, (50, 100, 150))
        print('--------------')
        for r in results:
            print(r)

进程通信

Python为进程通信提供了两种机制：

1.Queue：一个进程向 Queue 中放入数据，另一个进程从 Queue 中读取数据。

2.Pipe：Pipe 代表连接两个进程的管道。程序在调用 Pipe() 函数时会产生两个连接端，分别交给通信的两个进程，接下来进程既可从该连接端读取数据，也可向该连接端写入数据。

使用Queue实现进程间通信

multiprocessing 模块下的 Queue 和 queue 模块下的 Queue 基本类似，它们都提供了 qsize()、empty()、full()、put()、put_nowait()、get()、get_nowait() 等方法。区别只是 multiprocessing 模块下的 Queue 为进程提供服务，而 queue 模块下的 Queue 为线程提供服务。

下面程序使用 Queue 来实现进程之间的通信：

 1 import multiprocessing
 2 
 3 def f(q):
 4     print('(%s) 进程开始放入数据...' % multiprocessing.current_process().pid)
 5     q.put('Python')
 6 if __name__ == '__main__':
 7     # 创建进程通信的Queue
 8     q = multiprocessing.Queue()
 9     # 创建子进程
10     p = multiprocessing.Process(target=f, args=(q,))
11     # 启动子进程
12     p.start()
13     print('(%s) 进程开始取出数据...' % multiprocessing.current_process().pid)
14     # 取出数据
15     print(q.get())  # Python
16     p.join()

上面程序中，第 5 行代码（子进程）负责向 Queue 中放入一个数据，第 15 行代码（父进程）负责从 Queue 中读取一个数据，

这样就实现了父、子两个进程之间的通信。

使用Pipe实现进程间通信

使用 Pipe 实现进程通信，程序会调用 multiprocessing.Pipe() 函数来创建一个管道，该函数会返回两个 PipeConnection 对象，代表管道的两个连接端（一个管道有两个连接端，分别用于连接通信的两个进程）。

PipeConnection 对象包含如下常用方法：

1.send(obj)：发送一个 obj 给管道的另一端，另一端使用 recv() 方法接收。需要说明的是，该 obj 必须是可 picklable 的（Python 的序列化机制），

如果该对象序列化之后超过 32MB，则很可能会引发 ValueError 异常。

2.recv()：接收另一端通过 send() 方法发送过来的数据。

3.fileno()：关于连接所使用的文件描述器。

4.close()：关闭连接。

5.poll([timeout])：返回连接中是否还有数据可以读取。

6.send_bytes(buffer[, offset[, size]])：发送字节数据。如果没有指定 offset、size 参数，则默认发送 buffer 字节串的全部数据；如果指定了 offset 和 size 参数，则只发送 buffer 字节串中从 offset 开始、长度为 size 的字节数据。通过该方法发送的数据，应该使用 recv_bytes() 或 recv_bytes_into 方法接收。

7.recv_bytes([maxlength])：接收通过 send_bytes() 方法发迭的数据，maxlength 指定最多接收的字节数。该方法返回接收到的字节数据。

8.recv_bytes_into(buffer[, offset])：功能与 recv_bytes() 方法类似，只是该方法将接收到的数据放在 buffer 中。

使用 Pipe 来实现两个进程之间的通信:

 1 import multiprocessing
 2 def f(conn):
 3     print('(%s) 进程开始发送数据...' % multiprocessing.current_process().pid)
 4     # 使用conn发送数据
 5     conn.send('Python')
 6 if __name__ == '__main__':
 7     # 创建Pipe，该函数返回两个PipeConnection对象
 8     parent_conn, child_conn = multiprocessing.Pipe()
 9     # 创建子进程
10     p = multiprocessing.Process(target=f, args=(child_conn, ))
11     # 启动子进程
12     p.start()
13     print('(%s) 进程开始接收数据...' % multiprocessing.current_process().pid)
14     # 通过conn读取数据
15     print(parent_conn.recv())  # Python
16     p.join()

上面程序中第 6 行代码（子进程）通过 PipeConnection 向管道发送数据，数据将会被发送给管道另一端的父进程。

第 16 行代码（父进程）通过 PipeConnection 从管道读取数据，程序就可以读取到另一端子进程写入的数据，这样就实现了父、子两个进程之间的通信。

Python使用进程池管理进程和进程间通信

进程通信

使用Queue实现进程间通信

使用Pipe实现进程间通信

相关推荐

Linux使用定时器timerfd 和 eventfd接口实现进程线程通信

Python 进程池

linux下IPC通信

Linux下进程间通信：命名管道-mkfifo

Java调用python脚本，进程长时间卡住

linux进程管理学习笔记

PHP实现进程间通信:消息队列 msg_get_queue 函数不存在

[转载]PHP-FPM