博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
TBB之parallel_reduce
阅读量:4058 次
发布时间:2019-05-25

本文共 1668 字,大约阅读时间需要 5 分钟。

循环做的是reduce(最终输出的是单一的数),例如求和:

float SerialSumFoo( float a[], size_t n ) {    float sum = 0;    for( size_t i=0; i!=n; ++i )        sum += Foo(a[i]);    return sum;}

你能使用模板类parallel_reduce并行这个循环:

float ParallelSumFoo( const float a[], size_t n ) {    SumFoo sf(a);    parallel_reduce( blocked_range
(0,n), sf ); return sf.my_sum;}

这个类SumFoo说明了reduce的细节,例如,如何对子集求和,如何把他们结合起来,这是类SumFoo的定义:

class SumFoo {    float* my_a;public:    float my_sum;    void operator()( const blocked_range
& r ) { float *a = my_a; float sum = my_sum; size_t end = r.end(); for( size_t i=r.begin(); i!=end; ++i ) sum += Foo(a[i]); my_sum = sum; } SumFoo( SumFoo& x, split ) : my_a(x.my_a), my_sum(0) {} void join( const SumFoo& y ) {my_sum+=y.my_sum;} SumFoo(float a[] ) : my_a(a), my_sum(0) {}};

注意不同于ApplyFoo,首先,operator()不是一个const,这是因为它一定改变SumFoo::my_sum。第二,SumFoo有一个splitting构造函数和一个join方法一定被表示为parallel_reduce工作,splitting构造函数接受指向原始对象的 引用和一个标识符split,这个标识符由TBB库定义,使用split区分splitting构造函数和拷贝构造函数。

当一个工作线程可用时,任务调度器决定让parallel_reduce调度splitting构造函数为工作线程创建一个子任务,当子任务完成时,parallel_reduce使用方法join累计子任务的结果,下图显示在一个工作线程可用的情况下split-join次序:

这里写图片描述

如果一个工作线程不可用,the second half of the iteration使用相同的body对象做的reduce,在the first half结束后the reduction of the second half才会开始。

因为相同的body可能被使用累加多个子范围,operator()不能过早抛弃累加值是重要的,下面的的代码是错误的定义SumFoo::operator()。

class SumFoo {...public:    float my_sum;    void operator()( const blocked_range
& r ) { ... float sum = 0; // WRONG – should be "sum = my_sum". ... for( ... ) sum += Foo(a[i]); my_sum = sum; } ...};

上面的代码是错误的,它只返回最后子域的部分和,而不是全部子域。

你可能感兴趣的文章
cppcheck c++静态代码检查
查看>>
在C++中使用Lua
查看>>
socket编程中select的使用
查看>>
关于无人驾驶的过去、现在以及未来,看这篇文章就够了!
查看>>
所谓的进步和提升,就是完成认知升级
查看>>
为什么读了很多书,却学不到什么东西?
查看>>
长文干货:如何轻松应对工作中最棘手的13种场景?
查看>>
如何用好碎片化时间,让思维更有效率?
查看>>
No.174 - LeetCode1305 - 合并两个搜索树
查看>>
No.175 - LeetCode1306
查看>>
No.176 - LeetCode1309
查看>>
No.182 - LeetCode1325 - C指针的魅力
查看>>
mysql:sql alter database修改数据库字符集
查看>>
mysql:sql truncate (清除表数据)
查看>>
yuv to rgb 转换失败呀。天呀。谁来帮帮我呀。
查看>>
yuv420 format
查看>>
yuv420 还原为RGB图像
查看>>
LED恒流驱动芯片
查看>>
驱动TFT要SDRAM做为显示缓存
查看>>
使用file查看可执行文件的平台性,x86 or arm ?
查看>>