Re: [Python-de] Umlautproblem in Python 2.3

14 Feb 2003

      Detlef Lannert wrote:
...
Naja, immerhin. Die Programmierer im fernen Osten haben
wahrscheinlich ihre lokalen Schriftzeichen ohnehin nur in Unicode-
Strings untergebracht (seit es letztere gibt).
Auch bei Unicode-Literals in einem nicht-Unicode Quelltext muss
der Zeichensatz bekannt sein, damit der Interpreter sie richtig
verarbeiten kann.  Kuerzlich wurde doch hier ein Unicode-FAQ
gepostet, welches das sehr anschaulich erklaert. Das meiste, was
ich zum Thema weiss, habe ich auch von dort...
...
OK, jetzt verstehe ich das Problem. Aber dann würde es genügen, für
Multibyte-Codierungen eine Code-Deklaration zu verlangen, die ja
bisher nicht verwendbar waren.
Der Parser hat keine Moeglichkeit, von sich aus festzustellen,
ob ein 8-Bit Wert zu einem Single- oder einem Multibyte-Zeichen
gehoert. Er muss also entweder fuer allen 8-Bit Input eine
Deklaration vorschreiben, oder diesen komplett verbieten, wenn
Mehrdeutigkeiten zuverlaessig vermieden werden sollen.

Je schneller alle auf UTF-16 umstellen, desto besser... ;)

-schorsch

-- 
Georg Mischler  --  simulations developer  --  schorsch at schorsch com
+schorsch.com+  --  lighting design tools  --  http://www.schorsch.com/

_______________________________________________
Python-de maillist  -  Python-de@starship.python.net
http://starship.python.net/mailman/listinfo/python-de