这里只是记录学习的例子:
服务器端(test_master.py):
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
#多进程分布式例子
#服务器端
from multiprocessing.managers import BaseManager
from multiprocessing import freeze_support #server启动报错,提示需要引用此包
import random,time,Queue
#发送任务的队列
task_queue = Queue.Queue()
#接收结果的队列
result_queue = Queue.Queue()
#从BaseManager继承的QueueManager
class QueueManager(BaseManager):
pass
#win7 64 貌似不支持callable下调用匿名函数lambda,这里封装一下
def return_task_queue():
global task_queue
return task_queue
def return_result_queue():
global result_queue
return result_queue
def test():
#把两个Queue注册到网络上,callable参数关联了Queue对象
#QueueManager.register('get_task_queue',callable=lambda:task_queue)
#QueueManager.register('get_result_queue',callable=lambda:result_queue)
QueueManager.register('get_task_queue', callable=return_task_queue)
QueueManager.register('get_result_queue', callable=return_result_queue)
#绑定端口5000,设置验证码‘abc’
manager = QueueManager(address=('127.0.0.1',5000),authkey=b'abc')#这里必须加上本地默认ip地址127.0.0.1
#启动Queue
manager.start()
#server = manager.get_server()
#server.serve_forever()
print('start server master')
#获得通过网络访问的Queue对象
task = manager.get_task_queue()
result = manager.get_result_queue()
#放几个任务进去
for i in range(10):
n = random.randint(0,10000)
print('put task %d...' % n)
task.put(n)
#从result队列读取结果
print('try get results...')
for i in range(10):
r = result.get(timeout=10)
print('result:%s' % r)
#关闭
manager.shutdown()
print('master exit')
if __name__ == '__main__':
freeze_support()
test()
任务工作端(test_worker.py):
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
#多进程分布式例子
#非服务端:worker
import time,sys,Queue
from multiprocessing.managers import BaseManager
#创建类似的QueueManager
class QueueManager(BaseManager):
pass
#由于这个QueueManager只从网络上获取Queue,所以注册时只提供名字即可
QueueManager.register('get_task_queue')
QueueManager.register('get_result_queue')
#连接到服务器,也就是运行task_master.py的机器
server_addr = '127.0.0.1'
print('connect to server %s...'% server_addr)
#端口和验证码注意要保持完全一致
m = QueueManager(address=(server_addr,5000),authkey=b'abc')
#从网络连接
m.connect()
#获取Queue的对象
task = m.get_task_queue()
result = m.get_result_queue()
#从task队列获取任务,并把结果写入result队列
for i in range(10):
try:
n = task.get(timeout=1)
print('run task %d * %d...'% (n,n))
r = '%d * %d = %d' % (n,n,n*n)
time.sleep(1)
result.put(r)
except Queue.Empty:
print('task queue is empty')
#处理结果
print('worker exit')
结果图:
注意Queue的作用是用来传递任务和接收结果,每个任务的描述数据量要尽量小。比如发送一个处理日志文件的任务,就不要发送几百兆的日志文件本身,而是发送日志文件存放的完整路径,由Worker进程再去共享的磁盘上读取文件。
本文由 Ryan 创作,采用 知识共享署名4.0 国际许可协议进行许可
本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名
最后编辑时间为:
2017/11/21 19:29