Used astyle --style=kr formatted source codes.
[charm.git] / examples / charm++ / nodeHelper / fft-trans / README.nodelib
1 Simple test application to try node level parallelization of FFT using
2 threads in the NodeHelper library compared to a standard charm level
3 decomposition.
4
5 The main distinction here is node level shared memory awareness.  The
6 NodeHelper library will exploit that whereas the charm decomposition
7 will not.  
8
9 We are also interested in getting a sense of at what level of
10 granularity it is worth trying to do node level parallelism.  It is
11 expected that a lower bound on practically parallelizable grainsize
12 will exist as determined by cache locality and function call overhead.
13 Below that threshold it won't be worth trying to explicitely exploit
14 the available data parallelism.  Hopefully this number is larger than
15 a few fft lines with tens to hundreds of points.
16
17 For simplicity we do a single FFT for complex to complex using single
18 precision as this is typical for NAMD.  A more advanced version would
19 do real to complex, but that is more pain than necessary to
20 demonstrate utility.
21