<div dir="ltr"><br><br><div class="gmail_quote">On Tue, Apr 21, 2015 at 10:55 AM Donald Stufft <<a href="mailto:donald@stufft.io">donald@stufft.io</a>> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Just thought I'd share this since it shows how what people are using to<br>
download things from PyPI have changed over the past year. Of particular<br>
interest to most people will be the final graphs showing what percentage of<br>
downloads from PyPI are for Python 3.x or 2.x.<br>
<br>
As always it's good to keep in mind, "Lies, Damn Lies, and Statistics". I've<br>
tried not to bias the results too much, but some bias is unavoidable. Of<br>
particular note is that a lot of these numbers come from pip, and as of version<br>
6.0 of pip, pip will cache downloads by default. This would mean that older<br>
versions of pip are more likely to "inflate" the downloads than newer versions<br>
since they don't cache by default. In addition if a project has a file which<br>
is used for both 2.x and 3.x and they do a ``pip install`` on the 2.x version<br>
first then it will show up as counted under 2.x but not 3.x due to caching (and<br>
of course the inverse is true, if they install on 3.x first it won't show up<br>
on 2.x).<br>
<br>
Here's the link: <a href="https://caremad.io/2015/04/a-year-of-pypi-downloads/" target="_blank">https://caremad.io/2015/04/a-year-of-pypi-downloads/</a><br>
<br>
Anyways, I'll have access to the data set for another day or two before I<br>
shut down the (expensive) server that I have to use to crunch the numbers so if<br>
there's anything anyone else wants to see before I shut it down, speak up soon.<br></blockquote><div><br></div><div>Thanks!</div><div><br></div><div>I like your focus on particular packages of note such as django and requests.</div><div><br></div><div>How do CDNs influence these "lies"?  I thought the download counts on PyPI were effectively meaningless due to CDN mirrors fetching and hosting things?</div><div><br></div><div>Do we have user-agent logs from all PyPI package CDN mirrors or just from the master?</div><div><br></div><div>-gps</div></div></div>