<div dir="ltr">On Mon, Aug 28, 2017 at 10:13 AM, Jonathan Taylor <<a href="mailto:jonathan.taylor@stanford.edu">jonathan.taylor@stanford.edu</a>> wrote:<br>><br>> Thanks for all the help.<br>><br>> That said, I'm not sure it is an issue of the strides. I can easily recreate the slowdown as in the above gist ( <a href="https://gist.github.com/da7b2ef6ef109511af06a9cebbfc8ed1">https://gist.github.com/da7b2ef6ef109511af06a9cebbfc8ed1</a> ). Also, modifying the flags of a user-created ndarray so they agree with the loaded one is still noticably faster than using the array from `scipy.io.loadmat`<br><br>Ah yeah, if the data is aligned, then that might end up faster. Your optimized BLAS will be able to use certain CPU instructions that require aligned data. Setting the ALIGNED flag to false won't actually make the data unaligned; your BLAS checks the data itself, not the numpy flag.<br><br>> For my purposes, a copy is just fine, but I think this might be an issue that could be looked into. Perhaps I should file an issue on github?<br><br>It might be worth checking if scipy.io.loadmat() can be made to ensure that it always creates aligned arrays. There isn't anything to be done about .dot(), though.<br><br>--<br>Robert Kern</div>