<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><div class="">Hi Stephan, </div><div class="">thanks for the note. The progress over last two years wasn't impressive IMO, but I hope you'll manage.</div><div class=""><br class=""></div><div class="">As you suggest, I'll have a look at xarray too, as I see xarray.Dataset. </div><div class="">I was sure that it doesn't work with non-homogeneous data at all, clearly I need to refresh my opinion.</div><div class=""><br class=""></div><div class=""><br class=""></div><br class=""><div><blockquote type="cite" class=""><div class="">22 февр. 2017 г., в 20:55, Stephan Hoyer <<a href="mailto:shoyer@gmail.com" class="">shoyer@gmail.com</a>> написал(а):</div><br class="Apple-interchange-newline"><div class=""><div dir="ltr" class=""><div class="gmail_extra"><div class="gmail_quote">On Wed, Feb 22, 2017 at 8:57 AM, Alex Rogozhnikov <span dir="ltr" class=""><<a href="mailto:alex.rogozhnikov@yandex.ru" target="_blank" class="">alex.rogozhnikov@yandex.ru</a>></span> wrote:<br class=""><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div style="word-wrap:break-word" class=""><div class="">Pandas may be nice, if you need a report, and you need get it done tomorrow. Then you'll throw away the code. When we initially used pandas as main data storage in yandex/rep, it looked like an good idea, but a year later it was obvious this was a wrong decision. In case when you build data pipeline / research that should be working several years later (using some other installation by someone else), usage of pandas shall be <i class="">minimal</i>. </div></div></blockquote><div class=""><br class=""></div><div class="">The pandas development team (myself included) is well aware of these issues. There are long term plans/hopes to fix this, but there's a lot of work to be done and some hard choices to make:</div><div class=""><a href="https://github.com/pandas-dev/pandas/issues/10000" class="">https://github.com/pandas-dev/pandas/issues/10000</a><br class=""></div><div class=""><a href="https://github.com/pandas-dev/pandas/issues/13862" class="">https://github.com/pandas-dev/pandas/issues/13862</a> </div><div class=""><br class=""></div><div class=""> That's why I am looking for a reliable pandas substitute, which should be: </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div style="word-wrap:break-word" class=""><div class="">- completely consistent with numpy and should fail when this wasn't implemented / impossible</div><div class="">- fewer new abstractions, nobody wants to learn one-more-way-to-manipulate-<wbr class="">the-data, specifically other researchers</div><div class="">- it may be less convenient for interactive data mungling</div><div class="">  - in particular, less methods is ok</div><div class="">- written code should be interpretable, and hardly can be misinterpreted.</div><div class="">- not super slow, 1-10 gigabytes datasets are a normal situation</div></div></blockquote><div class=""><br class=""></div><div class="">This has some overlap with our motivations for writing Xarray (<a href="http://xarray.pydata.org/" class="">http://xarray.pydata.org</a>), so I encourage you to take a look. It still might be more complex than you're looking for, but we did try to clean up the really ambiguous APIs from pandas like indexing.</div></div></div></div>
_______________________________________________<br class="">NumPy-Discussion mailing list<br class=""><a href="mailto:NumPy-Discussion@scipy.org" class="">NumPy-Discussion@scipy.org</a><br class="">https://mail.scipy.org/mailman/listinfo/numpy-discussion<br class=""></div></blockquote></div><br class=""></body></html>