<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Thu, Jan 9, 2014 at 3:54 PM, DaÏ€id <span dir="ltr"><<a href="mailto:davidmenhur@gmail.com" target="_blank">davidmenhur@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><br><div class="gmail_quote"><div class="im">On 8 January 2014 22:39, Julian Taylor <span dir="ltr"><<a href="mailto:jtaylor.debian@googlemail.com" target="_blank">jtaylor.debian@googlemail.com</a>></span> wrote:<br>


<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div style="overflow:hidden">As you can see even without real hardware support it is about 30% faster<br>



than inplace unblocked numpy due better use of memory bandwidth. Its<br>
even more than two times faster than unoptimized numpy.<br></div></blockquote><div><br></div></div><div>I have an i5, and AVX crashes, even though it is supported by my CPU.</div></div></div></div></blockquote><div><br></div>
<div>I forgot about the 32 byte alignment avx (as it is used in this code) requires. I pushed a new version that takes care of it.<br></div><div style="overflow:hidden">It should now work with avx.<br><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr"><div class="gmail_extra"><div class="gmail_extra"><br></div><div class="gmail_extra">Following the instructions in the readme, there is only one compiled file, npfma.so, but no .o.</div></div><div class="gmail_extra">


<br></div><br></div></blockquote><div>the .o files are in the build/ subfolder <br></div></div><br></div></div>