
Hallo, bin gerade dabei ein Reguläres Muster zu entwickeln. Das Muster selber funktioniert auch ganz gut bis auf eine Sache, ich möchte der Funktion re.compile 2 und mehr Flags übergeben. 1 Flag ist ja kein Problem wie folgendes Beispiel zeigt: a = re.compile(r"<[meta].*>",flags = re.I) Da Muster sucht in einem HTML Dokument nach Tags mit dem Bezeichner meta und berücksichtigt dabei die Groß- und Kleinschreibung nicht. Wenn ich jetzt aber zusätzlich auch noch das flag für Unicode ( flags=re.UNICODE) setzen möchte läuft das ganze auf den Hammer! Kann mir jemand mal ein richtiges Beispiel zeigen? Vielen Dank schon mal im voraus Albert PS: Ich weiß das man die meta Tags auch mit dem Modul sgmllib extrahieren kann. Da mir aber diese Modul für meine Zwecke ein bißchen zu groß und schwerfällig ist, möchte ich es über reguläre Ausdrücke machen. _______________________________________________ python-de maillist - python-de@python.net http://python.net/mailman/listinfo/python-de

On Sunday 27 February 2005 14:49, Albert Hermeling wrote:
Hallo,
bin gerade dabei ein Reguläres Muster zu entwickeln. Das Muster selber funktioniert auch ganz gut bis auf eine Sache, ich möchte der Funktion re.compile 2 und mehr Flags übergeben. 1 Flag ist ja kein Problem wie folgendes Beispiel zeigt:
a = re.compile(r"<[meta].*>",flags = re.I)
Versuch mal die Flags zu addieren.. Pete _______________________________________________ python-de maillist - python-de@python.net http://python.net/mailman/listinfo/python-de

--On Sonntag, 27. Februar 2005 14:49 Uhr +0100 Albert Hermeling <Albert.Hermeling@t-online.de> wrote:
jetzt aber zusätzlich auch noch das flag für Unicode ( flags=re.UNICODE) setzen möchte läuft das ganze auf den Hammer!
Auf den Hammer? Du willst wohl flags=re.I|re.UNICODE ??
PS: Ich weiß das man die meta Tags auch mit dem Modul sgmllib extrahieren kann. Da mir aber diese Modul für meine Zwecke ein bißchen zu groß und schwerfällig ist, möchte ich es über reguläre Ausdrücke machen.
Wer Parser mit regulären Ausdrücken schreibt muß eben leiden :-) -aj _______________________________________________ python-de maillist - python-de@python.net http://python.net/mailman/listinfo/python-de

Am Sonntag, 27. Februar 2005 15:06 schrieb Andreas Jung:
<Albert.Hermeling@t-online.de> wrote: --On Sonntag, 27. Februar 2005 14:49 Uhr +0100 Albert Hermeling
Hallo Andreas,
setzen möchte läuft das ganze auf den Hammer!
Auf den Hammer? Sagt man hier im Norden wenn etwas nicht funktioniert :-))
Du willst wohl flags=re.I|re.UNICODE ??
Genau das habe ich gesucht. Danke noch mal
PS: Ich weiß das man die meta Tags auch mit dem Modul sgmllib extrahieren Wer Parser mit regulären Ausdrücken schreibt muß eben leiden :-) Tja so ist das nun mal. Ich wollte das ganze zuerst auch mit einer Ableitung von sgmllib machen, als ich mir das Modul aber genauer angeschaut habe war ich ein bißchen erschreckt über die Menge an Code die unnütz ausgeführt wird. Mir geht es ja schließlich nur darum die Meta Tags auszulesen, alle HTML Tags zu entfernen und die HTML Entris in Unicode zu übersetzen. Die beiden zu letzt genannten Probleme habe ich übrigens schon gelöst :-)).
mfg Albert _______________________________________________ python-de maillist - python-de@python.net http://python.net/mailman/listinfo/python-de
participants (3)
-
Albert Hermeling
-
Andreas Jung
-
Hans-Peter Jansen