`
king_c
  • 浏览: 225805 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

C# 4.0 并行计算部分 [转发]

    博客分类:
  • c#
阅读更多

沿用微软的写法,System.Threading.Tasks.::.Parallel类,提供对并行循环和区域的支持。 我们会用到的方法有For,ForEach,Invoke。

一、简单使用

        首先我们初始化一个List用于循环,这里我们循环10次。(后面的代码都会按这个标准进行循环)

Code
  1.             Program .Data = new List <int >();
  2.             for (int i = 0; i < 10; i++)
  3.             {
  4.                 Data.Add(i);
  5.             }

        下面我们定义4个方法,分别为for,foreach,并行For,并行ForEach。并测试他们的运行时长。

Code
  1.         /// <summary>
  2.         /// 是否显示执行过程
  3.         /// </summary>
  4.         public bool ShowProcessExecution = false ;
  5.         /// <summary>
  6.         /// 这是普通循环for
  7.         /// </summary>
  8.         private void Demo1()
  9.         {
  10.             List <int > data = Program .Data;
  11.             DateTime dt1 = DateTime .Now;
  12.             for (int i = 0; i < data.Count; i++)
  13.             {
  14.                 Thread .Sleep(500);
  15.                 if (ShowProcessExecution)
  16.                     Console .WriteLine(data[i]);
  17.             }
  18.             DateTime dt2 = DateTime .Now;
  19.             Console .WriteLine("普通循环For运行时长:{0}毫秒。" , (dt2 - dt1).TotalMilliseconds);
  20.         }
  21.         /// <summary>
  22.         /// 这是普通循环foreach
  23.         /// </summary>
  24.         private void Demo2()
  25.         {
  26.             List <int > data = Program .Data;
  27.             DateTime dt1 = DateTime .Now;
  28.             foreach (var in data)
  29.             {
  30.                 Thread .Sleep(500);
  31.                 if (ShowProcessExecution)
  32.                     Console .WriteLine(i);
  33.             }
  34.             DateTime dt2 = DateTime .Now;
  35.             Console .WriteLine("普通循环For运行时长:{0}毫秒。" , (dt2 - dt1).TotalMilliseconds);
  36.         }
  37.         /// <summary>
  38.         /// 这是并行计算For
  39.         /// </summary>
  40.         private void Demo3()
  41.         {
  42.             List <int > data = Program .Data;
  43.             DateTime dt1 = DateTime .Now;
  44.             Parallel .For(0, data.Count, (i) =>
  45.             {
  46.                 Thread .Sleep(500);
  47.                 if (ShowProcessExecution)
  48.                     Console .WriteLine(data[i]);
  49.             });
  50.             DateTime dt2 = DateTime .Now;
  51.             Console .WriteLine("并行运算For运行时长:{0}毫秒。" , (dt2 - dt1).TotalMilliseconds);
  52.         }
  53.         /// <summary>
  54.         /// 这是并行计算ForEach
  55.         /// </summary>
  56.         private void Demo4()
  57.         {
  58.             List <int > data = Program .Data;
  59.             DateTime dt1 = DateTime .Now;
  60.             Parallel .ForEach(data, (i) =>
  61.             {
  62.                 Thread .Sleep(500);
  63.                 if (ShowProcessExecution)
  64.                     Console .WriteLine(i);
  65.             });
  66.             DateTime dt2 = DateTime .Now;
  67.             Console .WriteLine("并行运算ForEach运行时长:{0}毫秒。" , (dt2 - dt1).TotalMilliseconds);
  68.         }

下面是运行结果:

image

这里我们可以看出并行循环在执行效率上的优势了。

结论1:在对一个数组内的每一个项做单独处理时,完全可以选择并行循环的方式来提升执行效率。

原理1:并行计算的线程开启是缓步开启的,线程数量1,2,4,8缓步提升。(不详,PLinq最多64个线程,可能这也是64)

   

   

二、 并行循环的中断和跳出

        当在进行循环时,偶尔会需要中断循环或跳出循环。下面是两种跳出循环的方法Stop和Break,LoopState是循环状态的参数。

Code
  1.         /// <summary>
  2.         /// 中断Stop
  3.         /// </summary>
  4.         private void Demo5()
  5.         {
  6.             List <int > data = Program .Data;
  7.             Parallel .For(0, data.Count, (i, LoopState) =>
  8.             {
  9.                 if (data[i] > 5)
  10.                     LoopState.Stop();
  11.                 Thread .Sleep(500);
  12.                 Console .WriteLine(data[i]);
  13.             });
  14.             Console .WriteLine("Stop执行结束。" );
  15.         }
  16.         /// <summary>
  17.         /// 中断Break
  18.         /// </summary>
  19.         private void Demo6()
  20.         {
  21.             List <int > data = Program .Data;
  22.             Parallel .ForEach(data, (i, LoopState) =>
  23.             {
  24.                 if (i > 5)
  25.                     LoopState.Break();
  26.                 Thread .Sleep(500);
  27.                 Console .WriteLine(i);
  28.             });
  29.             Console .WriteLine("Break执行结束。" );
  30.         }

        执行结果如下:

image

结论2:使用Stop会立即停止循环,使用Break会执行完毕所有符合条件的项。

   

   

三、并行循环中为数组/集合添加项

        上面的应用场景其实并不是非常多见,毕竟只是为了遍历一个数组内的资源,我们更多的时候是为了遍历资源,找到我们所需要的。那么请继续看。

下面是我们一般会想到的写法:

Code
  1.         private void Demo7()
  2.         {
  3.             List <int > data = new List <int >();
  4.             Parallel .For(0, Program .Data.Count, (i) =>
  5.             {
  6.                 if (Program .Data[i] % 2 == 0)
  7.                     data.Add(Program .Data[i]);
  8.             });
  9.             Console .WriteLine("执行完成For." );
  10.         }
  11.         private void Demo8()
  12.         {
  13.             List <int > data = new List <int >();
  14.             Parallel .ForEach(Program .Data, (i) =>
  15.             {
  16.                 if (Program .Data[i] % 2 == 0)
  17.                     data.Add(Program .Data[i]);
  18.             });
  19.             Console .WriteLine("执行完成ForEach." );
  20.         }

看起来应该是没有问题的,但是我们多次运行后会发现,偶尔会出现错误如下:

image

这是因为List是非线程安全的类,我们需要使用System.Collections.Concurrent命名空间下的类型来用于并行循环体内。

 

说明
BlockingCollection<T> 为实现 IProducerConsumerCollection<T> 的线程安全集合提供阻止和限制功能。
ConcurrentBag<T> 表示对象的线程安全的无序集合。
ConcurrentDictionary<TKey, TValue> 表示可由多个线程同时访问的键值对的线程安全集合。
ConcurrentQueue<T> 表示线程安全的先进先出 (FIFO) 集合。
ConcurrentStack<T> 表示线程安全的后进先出 (LIFO) 集合。
OrderablePartitioner<TSource> 表示将一个可排序数据源拆分成多个分区的特定方式。
Partitioner 提供针对数组、列表和可枚举项的常见分区策略。
Partitioner<TSource> 表示将一个数据源拆分成多个分区的特定方式。

公共类

那么我们上面的代码可以修改为,加了了ConcurrentQueue和ConcurrentStack的最基本的操作。

Code
  1.         /// <summary>
  2.         /// 并行循环操作集合类,集合内只取5个对象
  3.         /// </summary>
  4.         private void Demo7()
  5.         {
  6.             ConcurrentQueue <int > data = new ConcurrentQueue <int >();
  7.             Parallel .For(0, Program .Data.Count, (i) =>
  8.             {
  9.                 if (Program .Data[i] % 2 == 0)
  10.                     data.Enqueue(Program .Data[i]);//将对象加入到队列末尾
  11.             });
  12.             int R;
  13.             while (data.TryDequeue(out R))//返回队列中开始处的对象
  14.             {
  15.                 Console .WriteLine(R);
  16.             }
  17.             Console .WriteLine("执行完成For." );
  18.         }
  19.         /// <summary>
  20.         /// 并行循环操作集合类
  21.         /// </summary>
  22.         private void Demo8()
  23.         {
  24.             ConcurrentStack <int > data = new ConcurrentStack <int >();
  25.             Parallel .ForEach(Program .Data, (i) =>
  26.             {
  27.                 if (Program .Data[i] % 2 == 0)
  28.                     data.Push(Program .Data[i]);//将对象压入栈中
  29.             });
  30.             int R;
  31.             while (data.TryPop(out R))//弹出栈顶对象
  32.             {
  33.                 Console .WriteLine(R);
  34.             }
  35.             Console .WriteLine("执行完成ForEach." );
  36.         }

ok,这里返回一个序列的问题也解决了。

结论3:在并行循环内重复操作的对象,必须要是thread-safe(线程安全)的。集合类的线程安全对象全部在System.Collections.Concurrent命名空间下。

   

   

四、返回集合运算结果/含有局部变量的并行循环

        使用循环的时候经常也会用到迭代,那么在并行循环中叫做 含有局部变量的循环 。下面的代码中详细的解释,这里就不啰嗦了。

Code
  1.         /// <summary>
  2.         /// 具有线程局部变量的For循环
  3.         /// </summary>
  4.         private void Demo9()
  5.         {
  6.             List <int > data = Program .Data;
  7.             long total = 0;
  8.             //这里定义返回值为long类型方便下面各个参数的解释
  9.             Parallel .For<long >(0,           // For循环的起点
  10.                 data.Count,                 // For循环的终点
  11.                 () => 0,                    // 初始化局部变量的方法(long),既为下面的subtotal的初值
  12.                 (i, LoopState, subtotal) => // 为每个迭代调用一次的委托,i是当前索引,LoopState是循环状态,subtotal为局部变量名
  13.                 {
  14.                     subtotal += data[i];    // 修改局部变量
  15.                     return subtotal;        // 传递参数给下一个迭代
  16.                 },
  17.                 (finalResult) => Interlocked .Add(ref total, finalResult) //对每个线程结果执行的最后操作,这里是将所有的结果相加
  18.                 );
  19.             Console .WriteLine(total);
  20.         }
  21.         /// <summary>
  22.         /// 具有线程局部变量的ForEach循环
  23.         /// </summary>
  24.         private void Demo10()
  25.         {
  26.             List <int > data = Program .Data;
  27.             long total = 0;
  28.             Parallel .ForEach<int , long >(data, // 要循环的集合对象
  29.                 () => 0,                      // 初始化局部变量的方法(long),既为下面的subtotal的初值
  30.                 (i, LoopState, subtotal) =>   // 为每个迭代调用一次的委托,i是当前元素,LoopState是循环状态,subtotal为局部变量名
  31.                 {
  32.                     subtotal += i;            // 修改局部变量
  33.                     return subtotal;          // 传递参数给下一个迭代
  34.                 },
  35.                 (finalResult) => Interlocked .Add(ref total, finalResult) //对每个线程结果执行的最后操作,这里是将所有的结果相加
  36.                 );
  37.             Console .WriteLine(total);
  38.         }

结论4:并行循环中的迭代,确实很伤人。代码太难理解了。

五、PLinq(Linq的并行计算)

           上面介绍完了For和ForEach的并行计算盛宴,微软也没忘记在Linq中加入并行计算。下面介绍Linq中的并行计算。

4.0中在System.Linq命名空间下加入了下面几个新的类:

 

说明
ParallelEnumerable 提供一组用于查询实现 ParallelQuery{TSource} 的对象的方法。这是 Enumerable 的并行等效项。
ParallelQuery 表示并行序列。
ParallelQuery<TSource> 表示并行序列。

原理2:PLinq最多会开启64个线程

原理3:PLinq会自己判断是否可以进行并行计算,如果不行则会以顺序模式运行。

原理4:PLinq会在昂贵的并行算法或成本较低的顺序算法之间进行选择,默认情况下它选择顺序算法。

   

在ParallelEnumerable中提供的并行化的方法

 

ParallelEnumerable 运算符 说明
AsParallel() PLINQ 的入口点。指定如果可能,应并行化查询的其余部分。
AsSequential() 指定查询的其余部分应像非并行 LINQ 查询一样按顺序运行。
AsOrdered() 指定 PLINQ 应保留查询的其余部分的源序列排序,直到例如通过使用 orderby 子句更改排序为止。
AsUnordered() 指定查询的其余部分的 PLINQ 不需要保留源序列的排序。
WithCancellation() 指定 PLINQ 应定期监视请求取消时提供的取消标记和取消执行的状态。
WithDegreeOfParallelism() 指定 PLINQ 应当用来并行化查询的处理器的最大数目。
WithMergeOptions() 提供有关 PLINQ 应当如何(如果可能)将并行结果合并回到使用线程上的一个序列的提示。
WithExecutionMode() 指定 PLINQ 应当如何并行化查询(即使默认行为是按顺序运行查询)。
ForAll() 多线程枚举方法,与循环访问查询结果不同,它允许在不首先合并回到使用者线程的情况下并行处理结果。
Aggregate() 重载 对于 PLINQ 唯一的重载,它启用对线程本地分区的中间聚合以及一个用于合并所有分区结果的最终聚合函数。

下面是PLinq的简单代码

Code
  1.         /// <summary>
  2.         /// PLinq简介
  3.         /// </summary>
  4.         private void Demo11()
  5.         {
  6.             var source = Enumerable .Range(1, 10000);
  7.             //查询结果按source中的顺序排序
  8.             var evenNums = from num in source.AsParallel().AsOrdered()
  9.                        where num % 2 == 0
  10.                        select num;
  11.             //ForAll的使用
  12.             ConcurrentBag <int > concurrentBag = new ConcurrentBag <int >();
  13.             var query = from num in source.AsParallel()
  14.                         where num % 10 == 0
  15.                         select num;
  16.             query.ForAll((e) => concurrentBag.Add(e * e));
  17.         }

上面代码中使用了ForAll,ForAll和foreach的区别如下:

image

 

PLinq的东西很繁杂,但是都只是几个简单的方法,熟悉下方法就好了。

分享到:
评论

相关推荐

    C#4.0语言规范 C#4.0语言规范C#4.0语言规范

    8. **异步编程模型**(Task Parallel Library, TPL):虽然C# 4.0本身并未引入异步关键字,但引入了TPL库,为编写并行和异步代码提供了基础框架,为后来的`async/await`特性奠定了基础。 9. **自动属性**:自动属性...

    C#4.0权威指南

    C#4.0是微软.NET Framework的重要组成部分,它在C#3.0的基础上进行了多方面的改进和增强。这本书首先会引导你了解C#的基础知识,包括变量、数据类型、控制流结构(如if语句和循环)、函数以及类等核心概念。这些基础...

    C#4.0权威指南电子书

    《C#4.0权威指南》是一本深受程序员喜爱的C#编程教程,全面而深入地介绍了C# 4.0版本的各种特性和技术。这本书不仅适合初学者,也适合有一定经验的开发者,帮助他们提升在.NET框架下使用C#进行软件开发的专业技能。 ...

    全面揭秘 c# 4.0

    C# 4.0是.NET Framework的重要组成部分,它带来了许多增强的功能,使得开发更加高效且灵活。 首先,C# 4.0引入了动态类型(dynamic),这是一个非常关键的变化。动态类型允许在运行时确定变量的实际类型,这对于与...

    C#4.0规范中文版PDF

    C# 4.0是微软开发的一种面向对象的编程语言,它是.NET Framework的一部分。此版本在C# 3.0的基础上进行了若干关键性的改进和扩展,旨在提升语言的灵活性和兼容性。以下是一些C# 4.0中的关键知识点: 1. **动态类型...

    C# 4.0完全参考手册

    2. **Parallel LINQ (PLINQ)**:将并行计算的概念引入到LINQ,提升数据处理速度。 3. **Concurrent Collections**:线程安全的集合类,确保在多线程环境下的正确性。 四、异步编程 C# 4.0引入了异步编程模型,通过`...

    C#4.0图解教程个人笔记

    3. **多线程与并发**:C# 4.0通过`Task`类和`Task Parallel Library (TPL)`,提升了对多核处理器的利用,简化了并行编程,增强了程序的执行效率。 4. **异步编程(Asynchronous Programming)**:C# 4.0引入了`...

    C# 4.0 的4个新特性

    为了更好地利用多核处理器的优势,C# 4.0增强了对并行编程的支持。这主要通过引入新的并行编程库(PLINQ)来实现,该库基于现有的LINQ技术。 **示例代码**: ```csharp public IEnumerable&lt;ProductInfo&gt; ...

    C#4.0权威指南.pd

    语法篇对C#的语法进行了系统而全面的讲解,包括标识符和关键字、变量和常量、类型以及类型转换、表达式和运算符、语句、方法、类、继承、多态、接口、结构、枚举、委托、事件、泛型、数组、集合、字符串和正则表达式...

    Programming C# 4.0 6th.Edition

    为了更好地支持多核处理器和并发编程,C# 4.0 加强了对并行编程的支持,引入了新的并行集合类型以及并行循环等特性,使得编写高性能并发应用变得更加容易。 #### 3. 扩展方法和命名空间别名 扩展方法在C# 3.0中...

    C#4.0权威指南 源代码

    C# 4.0是.NET Framework的重要组成部分,它在C# 3.0的基础上引入了许多新特性,使得开发者可以编写出更高效、更灵活的代码。以下是C# 4.0的一些核心知识点: 1. **动态类型(Dynamic)**:C# 4.0引入了动态类型,...

    《C#4.0捷径教程》配套源码

    此为C#4.0捷径教程 一书的配套源码 好评如潮的C# 4.0实战图书 汲取.NET技术精髓的捷径 专章讲述习惯用法与设计模式 本书是经典教程的全面升级,通过许多精彩的示例介绍了C# 语言的每个新特性,深入浅出地讲解了C#...

    C#4.0权威指南原书+源码

    《C#4.0权威指南》是一本专为C#开发者设计的专业教程,全面涵盖了C#4.0语言的所有核心特性和高级主题。这本书旨在帮助读者深入理解C#编程语言,提升开发技能,并掌握.NET Framework的最新功能。通过阅读本书,开发者...

    C# 4.0 IN A NUTSHELL(Fourth Edition)

    作为“Nutshell”系列的一部分,本书继承了该系列简洁明了、内容丰富的特点,并深入探讨了C# 4.0的新特性和高级主题。 #### 版权信息与出版历史 本书由O'Reilly Media, Inc.出版,自2002年第一版以来经历了多次...

    C#4.0本质论

    Essential C# 4.0已经是第三版,从发布以来受到广大.Net开发人员的关注。该书详细介绍C#在.Net Framework 4.0中的应用,介绍C# 4.0新特征,适合.Net开发人员作为参考书使用。

    C#4.0的一些新特性

    ### C#4.0的新特性详解 随着Visual Studio 2010的正式发布,C#4.0作为其中的一项重要更新,引入了一系列新的特性,这些特性极大地提升了开发者的编程体验,并增强了C#语言的功能性。本文将详细介绍C#4.0中的两个...

    AW - Essential C# 4.0, 3rd Edition Mar 2010+完美版

    Essential C# 4.0 完美版 附件里有两个pdf,内容完全一样,似乎清晰度不一样 984 pages Publisher: Addison-Wesley Professional; 3 edition (March 20, 2010) Language: English ISBN-10: 0321694694 ISBN-13:...

Global site tag (gtag.js) - Google Analytics