<br><div><span class="gmail_quote">On 10/11/07, <b class="gmail_sendername">Guido van Rossum</b> &lt;<a href="mailto:guido@python.org">guido@python.org</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
On 10/11/07, Christian Heimes &lt;<a href="mailto:lists@cheimes.de">lists@cheimes.de</a>&gt; wrote:<br>&gt; Guido van Rossum wrote:<br>&gt; &gt; Um, where does the filename object in that expression come from? It<br>&gt; &gt; appears to be a PyString object. Who created it? That could should be
<br>&gt; &gt; changed to create a PyUnicode instead (using the filesystem encoding).<br>&gt;<br>&gt; Python/compile.c:makecode()<br>&gt; filename = PyString_FromString(c-&gt;c_filename);<br>&gt;<br>&gt; Modules/pyexpat.c:getcode()
<br>&gt; filename = PyString_FromString(__FILE__);<br>&gt;<br>&gt; Objects/codeobject.c:code_new()<br>&gt; PyArg_ParseTuple(args, &quot;iiiiiSO!O!O!SSiS|O!O!:code&quot;<br>&gt;<br>&gt; As I tried to explain earlier that may be a problem. PyUnicode_Decode()
<br>&gt; doesn&#39;t work so early. The codecs package isn&#39;t initialized yet.<br><br>But some codecs are &quot;built-in&quot; and have custom APIs. I wonder if we<br>could do something that figures out the default fs encoding, and see
<br>if it is one of the supported ones, and then uses that; otherwise<br>tries UTF-8 with the &quot;replace&quot; error handling option (so it won&#39;t fail<br>if the data is non-UTF-8).<br></blockquote><div><br>Thats pretty much what Christian pondered at the start of this thread but with a defined &quot;failure&quot; mode.
<br><br>+1 from me, give it a try and see what 3.0a2 testers say.&nbsp; Are there OSes and filesystems out there that&#39;d store in anything other than one of the popular codecs (UTF-8, 16, 32, latin1, mbcs)?&nbsp; That seems like a bad idea to me but obviously I don&#39;t run the world.
<br><br>-gps<br><br></div></div>