"Klaus-G. Meyer" <km-news3@onlinehome.de> writes:
Der häufig benutzte Latin-1-Zeichensatz ist identisch mit den ersten 256 Zeichen des Unicode-Zeichensatzes.
Wie bitte? Latin-1 ist ein 8-bit-Zeichensatz, Unicode (zumindest als ISO 10646, bzw. UCS-4) ist 32bit. Wie sollen die gleich sein? Gleiche Kodierungsnummern.
Das erleichtert allerdings überhaupt nichts. Die Konvertierung zwischen Unicode-Strings und Latin-1-Byte-Strings ist in jedem Fall durch einen Algorithmus auszuführen - nur dass der Algorithmus relativ effizient implementiert werden kann. Wäre Latin-9 das system encoding in Python, wäre das aber auch nicht komplizierter, als wenn es Latin-1 wäre. Ciao, Martin _______________________________________________ Python-de maillist - Python-de@python.net http://python.net/mailman/listinfo/python-de