<div dir="ltr"><div dir="ltr">2019年6月20日(木) 8:16 Mauricio Reis <<a href="mailto:reismc@ime.eb.br">reismc@ime.eb.br</a>>:<br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">But documentation (provided by a teacher in charge of the Cray computer) <br>
shows:<br>- each node: 1 CPU, 1 GPU, 32 GBytes<br></blockquote><div><br></div><div>If that's true, then it appears to me that running on any individual compute host (node) has 1-core / 2-threads, and that would be why you wouldn't get any more performance after n_jobs=2.</div><div>For n_jobs=3/4/..., you're just asking the same amount of compute hardware to do the same calculations.<br></div><div>As instructed, you'll need to execute joblib.cpu_count() to resolve your host environment.</div></div></div>