
Das heist also, das die os.getfiles etc, string zurueckliefern koennen, die in einem zeichensatz sind, die die codec funktionen nicht verstehen? Weird. Ich haette gedacht das die OS specifische python installation sich darum kuemmert -> soll heisen wenn ich ein file object habe, gehe ich davon aus das der dateiname in utf16 encoded ist. Silly me. Gibt es funktionen die mir sagen in welchem encoding ein string object ist? Beim durchblaettern von codec habe ich nix gefunden, aber das heist ja nix... Das mit 0x08 ist ein guter guess, und jup, das file sieht nicht nach utf8 aus - das ist ja das problemchen :). Mal schauen was ich damit mache.. Frank On 10/8/06, Georg Mischler <schorsch@schorsch.com> wrote:
Frank Mantek wrote:
Tja, das dachte ich urspruenglich auch... aber wenn ich in die geschriebene Datei schaue (geoffnet als UTF8 datei, mit BOM etc), dann sieht das halt gar nicht richtig aus...
Das ist z.B. der Hexdump:
44 00 69 00 65 00 20 00 6B 00 75 00 08 03 6E 00 D.i.e. .k.u...n.
0x08 ist in ASCII ein Backspace, also ein Schritt rückwärts.
Offenbar gibt es irgendeine Konvention, welche 0x0803 so interpretiert, dass die zwei Punkte über das vorhergehende Zeichen gesetzt werden. Du hast es also nicht mit einem einzelnen ü zu tun, sondern mit zwei seperaten Zeichen, aus welchen das ü grafisch zusammengesetzt wird.
Ich habe keine Ahnung, ob es sich dabei um einen standard-Zeichensatz handelt, geschweige denn ggf. um welchen. Falls du das nicht irgendwie noch rauskriegst, wäre es wohl am sinnvollsten, solche Zeichenkombinationen selber in etwas vernünftiges umzuwandeln.
Da sollte eigentlich künstlich stehen, utf8 codiert.
Dein hexdump sieht nicht nach utf8 aus.
Das witzige ist, das wenn ich vom programm aus ein "print variable" mache, dann bekomme ich den umlaut...
Die Terminalsoftware beherrscht offenbar die entsprechende Konvention.
-schorsch
-- Georg Mischler -- simulations developer -- schorsch at schorsch com +schorsch.com+ -- lighting design tools -- http://www.schorsch.com/
_______________________________________________ python-de maillist - python-de@python.net http://python.net/mailman/listinfo/python-de
_______________________________________________ python-de maillist - python-de@python.net http://python.net/mailman/listinfo/python-de