Tja, das dachte ich urspruenglich auch... aber wenn ich in die geschriebene Datei schaue (geoffnet als UTF8 datei, mit BOM etc), dann sieht das halt gar nicht richtig aus...

Das ist z.B. der Hexdump:

44 00 69 00 65 00 20 00 6B 00 75 00 08 03 6E 00     D.i.e. .k.u...n.

Da sollte eigentlich künstlich stehen, utf8 codiert.

Vielleicht ist was an meiner Python installation kaputt? laut version ist es 2.4.3, aber ich komme immer in den ValueError handler, anstatt das xmlcharrefreplace ausgefuehrt wird.  Oder irgendein encoding. Wenn ich z.B. den oberen string mit  variable.encode('utf8') encode  bekomme  ich den

: 'ascii' codec can't decode byte 0xcc in position 36: ordinal not in range(128)

und ich bin etwas irritiert, da ich ja versuche utf8 zu encoden (habe auch UTF8 oder UTF-8 etc ausprobiert. Oder UTF-7, 16 etc . alles mit dem gleichen resultat).

Das witzige ist, das wenn ich vom programm aus ein "print variable" mache, dann bekomme ich den umlaut...

Frank

(installation: das ist ein Mac, und da habe ich halt das letzte Python package installiert).

On 10/8/06, Jochen Schulz <ml@well-adjusted.de> wrote:
Frank Mantek:
>
> Einige der Dateinamen sind nun in Deutsch, mit Umlauten. Ich schaffe es
> nicht mit Python 2.4.3 eine Seite zu erzeugen in der ein umlaut A ordentlich
> HTML entity encoded wird.

Warum willst Du das tun? Die Angabe des richtigen charsets würde doch
ausreichen.

J.
--
If I was Mark Chapman I would have shot John Lennon with a water pistol.
[Agree]   [Disagree]
                 < http://www.slowlydownward.com/NODATA/data_enter2.html>


-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.5 (GNU/Linux)

iD8DBQFFKNDq+AfZydWK2zkRAoWxAKCsgekH2CBOqvhS5mO7ZJjFZlqqlACdGjSe
kIJzKSmuNDagfuZV7838sA0=
=Hbuc
-----END PGP SIGNATURE-----


_______________________________________________
python-de maillist  -  python-de@python.net
http://python.net/mailman/listinfo/python-de