Detlef Lannert wrote:
Naja, immerhin. Die Programmierer im fernen Osten haben wahrscheinlich ihre lokalen Schriftzeichen ohnehin nur in Unicode- Strings untergebracht (seit es letztere gibt).
Auch bei Unicode-Literals in einem nicht-Unicode Quelltext muss der Zeichensatz bekannt sein, damit der Interpreter sie richtig verarbeiten kann. Kuerzlich wurde doch hier ein Unicode-FAQ gepostet, welches das sehr anschaulich erklaert. Das meiste, was ich zum Thema weiss, habe ich auch von dort...
OK, jetzt verstehe ich das Problem. Aber dann würde es genügen, für Multibyte-Codierungen eine Code-Deklaration zu verlangen, die ja bisher nicht verwendbar waren.
Der Parser hat keine Moeglichkeit, von sich aus festzustellen, ob ein 8-Bit Wert zu einem Single- oder einem Multibyte-Zeichen gehoert. Er muss also entweder fuer allen 8-Bit Input eine Deklaration vorschreiben, oder diesen komplett verbieten, wenn Mehrdeutigkeiten zuverlaessig vermieden werden sollen. Je schneller alle auf UTF-16 umstellen, desto besser... ;) -schorsch -- Georg Mischler -- simulations developer -- schorsch at schorsch com +schorsch.com+ -- lighting design tools -- http://www.schorsch.com/ _______________________________________________ Python-de maillist - Python-de@starship.python.net http://starship.python.net/mailman/listinfo/python-de