<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Tue, Jun 13, 2017 at 8:53 PM, Nick Coghlan <span dir="ltr"><<a href="mailto:ncoghlan@gmail.com" target="_blank">ncoghlan@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On 13 June 2017 at 19:44, Thomas Kluyver <<a href="mailto:thomas@kluyver.me.uk">thomas@kluyver.me.uk</a>> wrote:<br>
> On Tue, Jun 13, 2017, at 02:27 AM, Nick Coghlan wrote:</span><br>
<span class=""><br>
> I've updated the PR to specify zip archives for build_wheel and .tar.gz<br>
> archives for build_sdist.<br>
<br>
</span>+1<br>
<br>
I've added one suggestion, which is to explicitly require PAX_FORMAT<br>
for the sdist tarballs produced this way (that's a POSIX format<br>
standardised in 2001 and supported by both 2.7 and 3.x that<br>
specifically requires that the paths be encoded as UTF-8). While the<br>
standard library does still default to GNU_FORMAT in general, the<br>
stated rationale for doing so (it being more widely supported than<br>
PAX_FORMAT) was last updated more than 10 years ago, and I don't think<br>
it applies here.</blockquote><div><br></div><div>I'm not trying to open a bikeshedding opportunity here -- and I tried to ignore it, honest! -- but why are tarballs preferable to zipfiles for sdists?</div><div><br></div><div>I looked around the 517 threads to see if it had been covered already, and all I found was that zipfiles have additional PKG-INFO expectations in existing implementations, and other honorable mentions of their features over tarballs.</div><div><br></div><div>I've never understood the anti-affinity towards zip because the format itself seems superior in many ways, such as the ability to easily append or replace-via-append (which might actually help perf when being used as an interchange format, with a repack/prune at the end), compress individual files, and the brilliance of placing the central directory/manifest at the end, allowing it to be appended to binaries, etc. and allowing rapid indexing of files. Tarballs are a black box.</div><div><br></div><div>Just seems a little odd/arbitrary to me that wheel is zip, python supports zip importing, sdists are often zip, and Windows is zip-central, but we'd decide to codify tar.gz. It doesn't affect me personally because I'm Linux all the way down and barely remember how to use Windows, but with all the existing zip usage, and technical superiority(?), if we are going to pick something, why not that? At that point Python is all-zip and no-tar.</div><div><br></div><div>It's not a strong opinion really, but since the PEP does attempt to limit what's currently possible, can we add some verbiage as to why tar.gz is preferred? Or consider it with more scrutiny?</div><div> </div></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><br>C Anthony</div>
</div></div>