<div dir="ltr"><div><div>I've been thinking that my language is not specific enough.  The reason for the performance difference is not only that the DE population *changes* during processing of a generation; rather that it *improves* within the generation.<br><br></div>This improvement means that crossover during a generation is increasingly likely to yield further improvement as the processing of the generation proceeds.  So the current serial and equivalent parallelized implementations are actually, literally, different algorithms.<br><br></div><div>Regarding the number of calculations: since the algorithms are different, the optimum crossover probabilities and choice of [rand, bin, etc.] mutation methods can be different.  Comparing non-optimal tuning parameters for the different algorithms will not yield numbers for total calculations that are directly comparable.<br></div><div><br></div><div>I dislike using arcane technical jargon, but this situation seems most accurately described in the literature as "poopy-doopy".<br><br></div>James<br><br></div>