<div dir="ltr"><div>Would a separate repo scipy-datasets help ? Then something like <br><br>try: <br>     importing <br>except: <br></div>    warn('I'm off to interwebz')<br><div>    download from the repo<br><br></div><div>might be feasible. The download part can either be that particular dataset or the whole scipy-datasets clone. <br></div><div><br><br><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Mar 30, 2018 at 1:16 AM, Stefan van der Walt <span dir="ltr"><<a href="mailto:stefanv@berkeley.edu" target="_blank">stefanv@berkeley.edu</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On Thu, 29 Mar 2018 18:54:52 -0400, Warren Weckesser wrote:<br>
> Can you summarize the problems that make you regret including the<br>
> data?<br>
<br>
</span>- The size of the repository (extra time on each clone, and that for<br>
  data that isn't necessary in most use cases)<br>
<br>
- Artificial limit on data sizes: we now have a default place to store<br>
  data, but we still need an additional mechanism for larger datasets.<br>
  How do you choose the threshold for what goes in, what is too big?<br>
<br>
- Because these tiny embedded datasets are easily available, they become<br>
  the default for demos.  If data is stored externally, realistic<br>
  examples become more feasible and likely.<br>
<div class="HOEnZb"><div class="h5"><br>
Best regards<br>
Stéfan<br>
______________________________<wbr>_________________<br>
SciPy-Dev mailing list<br>
<a href="mailto:SciPy-Dev@python.org">SciPy-Dev@python.org</a><br>
<a href="https://mail.python.org/mailman/listinfo/scipy-dev" rel="noreferrer" target="_blank">https://mail.python.org/<wbr>mailman/listinfo/scipy-dev</a><br>
</div></div></blockquote></div><br></div>