ronin47

浏览: 999888 次
性别:
来自: 上海

最近访客更多访客>>

Sun_kiss

oszerone

hc_face

u012363178

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

最简单的 python 并行实现方式

博客分类：

python&nodejs

python 并行

简介

在介绍如何最简单地利用 python 实现并行前，我们先来看一个简单的代码。

1
2
3

words = ['apple', 'bananan', 'cake', 'dumpling']

for word in words:
    print word

上面的例子中，我们用一个 for 循环打印出 words 列表中的每个单词。问题来了，这里我们打印完一个单词才能接着打印另一个单词，能不能同时打印呢？好比如在银行的营业厅排队，如果只开一个窗口办理业务，你需要等前面一个人办完，才轮到你，如果能开多个窗口，显然会快很多。

我们将上面的代码抽象成下面的模式：

1
2
3

items = list()

for item in items:
    process(item)

其中，items 是一个列表，process(arg) 是一个函数，可以有返回值也可以没有。我们希望可以将这种模式改成并行处理的方式，比如可以引入多线程等处理方式，但是这些处理方式往往会让代码变得更加复杂。那么有什么简单的处理方式吗？

并行化

我们将上面的串行模式进行简单地改造，使之可以并行处理：

from multiprocessing.dummy import Pool as ThreadPool
 
items = list()
 
pool = ThreadPool()
pool.map(process, items)
pool.close()
pool.join()

下面我们进行测试：

# -*- coding: utf-8 -*-
 

import time

from multiprocessing.dummy import Pool as ThreadPool
 
def get_logger(name):
    logger = logging.getLogger(name)
    logger.setLevel(logging.DEBUG)
 
    stream_handler = logging.StreamHandler()
    stream_handler.setLevel(logging.DEBUG)
 
    formatter = logging.Formatter(
        '%(asctime)s - %(name)s [%(levelname)s] %(message)s')
 
    stream_handler.setFormatter(formatter)
    logger.addHandler(stream_handler)
 
    return logger
 
def process(item):
    log = _get_logger(item)
    log.info("item: %s" % item)
    time.sleep(5)
 
 
items = ['apple', 'bananan', 'cake', 'dumpling']
 
pool = ThreadPool()
pool.map(process, items)
pool.close()
pool.join()

输出结果:

2016-06-07 11:23:57,530 - apple [INFO] word: apple
2016-06-07 11:23:57,530 - bananan [INFO] word: bananan
2016-06-07 11:23:57,530 - cake [INFO] word: cake
2016-06-07 11:23:57,531 - dumpling [INFO] word: dumpling

从上面显示的时间可以看到，我们已经由原来的串行打印变成并行打印了。

另外，上面的处理函数 process 是没有返回值的。假设 process 函数的返回值是 result，那么 results = pool.map(process, items) 的返回值是一个列表，每个元素对应着处理每个 item 的结果。

因此，

results = list()
 
for item in item_list:
    result = process(item)
    results.append(result)
 
return results

上面的串行处理可以改成下面的并行处理：

from multiprocessing.dummy import Pool as ThreadPool
 
pool = ThreadPool()
results = pool.map(process, item_list)
pool.close()
pool.join()
 

return results

参考资料

分享到：

这是看过对python日志解释比较全的文章 | 异步任务神器 Celery

2017-02-16 11:39
浏览 560
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最简单的 python 并行实现方式

简介

并行化

参考资料

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最简单的 python 并行实现方式

简介

并行化

参考资料

评论

发表评论

相关推荐

python 类装饰器的四种场景写法

python logging 重复写日志问题

CSS 黑魔法小技巧，让你少写不必要的JS，代码更优雅

Redis 数据类型及应用场景

数据可视化的开源方案: Superset vs Redash vs Metabase

Nginx 限制单个IP的并发连接数/速度来减缓垃圾蜘蛛爬虫采集

docker 升级到最新版

PyMongo 常见问题

Python实战mongodb第3篇: Pymongo的分页查询

SQL转 MongoDB语法速查表

Logstash由于时区导致8小时时差解决方案

Kombu 源码解析一

分布式SQL查询引擎Presto原理介绍

一行Python代码实现树结构

命令行神器 Click

django 流式大文件文件下载

filebeat to elasticsearch针对于filebeat端性能优化--性能提升230%

re必杀技正则表达式大全——包括校验数字、字符、一些特殊的需求等等

n种elasticsearch按照日期定时批量删除索引

10个Python面试常问的问题

最近访客更多访客>>