<html><head><style>body{font-family:Helvetica,Arial;font-size:13px}</style></head><body style="word-wrap:break-word;line-break:after-white-space"><div id="bloop_customfont" style="font-family:Helvetica,Arial;font-size:13px;color:rgba(0,0,0,1.0);margin:0px;line-height:auto">Including some datasets would also help the scipy benchmarks be a more realistic. Right now the benchmarks use synthetic data (at least the signal benchmarks do).</div><div id="bloop_customfont" style="font-family:Helvetica,Arial;font-size:13px;color:rgba(0,0,0,1.0);margin:0px;line-height:auto"><br></div> <div id="bloop_sign_1522370806501284096" class="bloop_sign">Scott</div> <br><p class="airmail_on">On March 29, 2018 at 7:17:28 PM, Ilhan Polat (<a href="mailto:ilhanpolat@gmail.com">ilhanpolat@gmail.com</a>) wrote:</p> <blockquote type="cite" class="clean_bq"><span><div><div></div><div>


<title></title>


<div dir="ltr">Yes, that's true but GitHub seems like a robust
place to live. Otherwise we can just point to any hardcoded URL.
But if the size gets bigger in terms of wheels and cloning I think
within SciPy doesn't seem to be a viable option. These all depend
on what the future of datasets would be.<br></div>
<div class="gmail_extra"><br>
<div class="gmail_quote">On Fri, Mar 30, 2018 at 2:03 AM,
<span dir="ltr"><<a href="mailto:josef.pktd@gmail.com" target="_blank">josef.pktd@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<span class="">On Thu, Mar 29, 2018 at 7:54 PM, Ilhan Polat
<<a href="mailto:ilhanpolat@gmail.com">ilhanpolat@gmail.com</a>>
wrote:<br>
> Would a separate repo scipy-datasets help ? Then something
like<br>
><br>
> try:<br>
>      importing<br>
> except:<br>
>     warn('I'm off to interwebz')<br>
>     download from the repo<br>
><br>
> might be feasible. The download part can either be that
particular dataset<br>
> or the whole scipy-datasets clone.<br>
><br>
<br></span>IMO:<br>
<br>
It depends on the scale where this should go.<br>
I don't think it's worth it (maintaining and installing
another<br>
package or repo) for scipy<br>
given that scipy is mostly a basic numerical library and not driven
by specific<br>
applications.<br>
<br>
For most areas there should be already some online repos or
packages and<br>
it would be enough to have the accessing functions in
scipy.datasets.<br>
The only area that I can think of where there might not be some
readily<br>
available online source for datasets is signal.<br>
<br>
Josef<br>
<div class="HOEnZb">
<div class="h5"><br>
<br>
><br>
><br>
><br>
> On Fri, Mar 30, 2018 at 1:16 AM, Stefan van der Walt
<<a href="mailto:stefanv@berkeley.edu">stefanv@berkeley.edu</a>><br>
> wrote:<br>
>><br>
>> On Thu, 29 Mar 2018 18:54:52 -0400, Warren Weckesser
wrote:<br>
>> > Can you summarize the problems that make you regret
including the<br>
>> > data?<br>
>><br>
>> - The size of the repository (extra time on each clone,
and that for<br>
>>   data that isn't necessary in most use
cases)<br>
>><br>
>> - Artificial limit on data sizes: we now have a default
place to store<br>
>>   data, but we still need an additional
mechanism for larger datasets.<br>
>>   How do you choose the threshold for what goes
in, what is too big?<br>
>><br>
>> - Because these tiny embedded datasets are easily
available, they become<br>
>>   the default for demos.  If data is stored
externally, realistic<br>
>>   examples become more feasible and
likely.<br>
>><br>
>> Best regards<br>
>> Stéfan<br>
>>
______________________________<wbr>_________________<br>
>> SciPy-Dev mailing list<br>
>> <a href="mailto:SciPy-Dev@python.org">SciPy-Dev@python.org</a><br>
>> <a href="https://mail.python.org/mailman/listinfo/scipy-dev" rel="noreferrer" target="_blank">https://mail.python.org/<wbr>mailman/listinfo/scipy-dev</a><br>

><br>
><br>
><br>
> ______________________________<wbr>_________________<br>
> SciPy-Dev mailing list<br>
> <a href="mailto:SciPy-Dev@python.org">SciPy-Dev@python.org</a><br>
> <a href="https://mail.python.org/mailman/listinfo/scipy-dev" rel="noreferrer" target="_blank">https://mail.python.org/<wbr>mailman/listinfo/scipy-dev</a><br>

><br>
______________________________<wbr>_________________<br>
SciPy-Dev mailing list<br>
<a href="mailto:SciPy-Dev@python.org">SciPy-Dev@python.org</a><br>
<a href="https://mail.python.org/mailman/listinfo/scipy-dev" rel="noreferrer" target="_blank">https://mail.python.org/<wbr>mailman/listinfo/scipy-dev</a><br>
</div>
</div>
</blockquote>
</div>
<br></div>


_______________________________________________
<br>SciPy-Dev mailing list
<br><a href="mailto:SciPy-Dev@python.org">SciPy-Dev@python.org</a>
<br><a href="https://mail.python.org/mailman/listinfo/scipy-dev">https://mail.python.org/mailman/listinfo/scipy-dev</a>
<br></div></div></span></blockquote></body></html>