Unterschiede htmllib und HTMLParser und Eignung

Hi, ich hab da mal ne Frage zu obigen beiden Parsern: Wo liegen da die Unterschiede? Auf den ersten Blick scheint die "nicht-Ableitung" von sgmllib der einzige Unterschied zu sein und das htmllib wohl keinen aktuellen HTML-Standard unterstuetzt? Ist einer von beiden "schneller" oder fuer das folgende Szenario besser geeignet oder ists egal? Ich hab einen HTML-Ausschnitt der von BeautifulSoup bereits "bereinigt" wurde und will jetzt beim Durchlaufen der Tags einige "weglassen" und einige evtl. umformen um das ganze dann in einem "Richtext"-UI-Element anzuzeigen. Andreas -- You'll feel devilish tonight. Toss dynamite caps under a flamenco dancer's heel. _______________________________________________ python-de maillist - python-de@python.net http://python.net/mailman/listinfo/python-de

-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Andreas Pakulat schrieb:
ich hab da mal ne Frage zu obigen beiden Parsern: Wo liegen da die Unterschiede? Auf den ersten Blick scheint die "nicht-Ableitung" von
Aus http://www.python.org/doc/lib/module-HTMLParser.html: Unlike the parser in htmllib, this parser does not check that end tags match start tags or call the end-tag handler for elements which are closed implicitly by closing an outer element. - -- Schönen Gruß - Regards Hartmut Goebel | Hartmut Goebel | IT-Security -- effizient | | h.goebel@goebel-consult.de | www.goebel-consult.de | -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.2 (GNU/Linux) Comment: Using GnuPG with Mandriva - http://enigmail.mozdev.org iQEVAwUBQ+XV8MzajR0mSa83AQJ+ggf/cdc2+FaztJ7zfl14RxwffnxJoklRWnvp 592Gz+iLhukZhs7XkZVltunnHuZk2U6sC+UQ9o08QIfQJCpjkPkZQ0ZQr/2NIh92 7A5KXVQRWX505KoO8LYJYd+xzI+J4G5W7+4ujQUrZgZKgQexP13d+9LDcAB9JJl9 c5pjrF56RajrN7UIZa3U+x03YkiuPXLfhmA+uOw3PQXrjm2EIX6KZ2jHr5ZdjuMP 3Z6MyNt2RFZTHNk67pomoIlmqrj7jJccWZwXKd64E31gCRP7zUPr/BweHYiRL5hR D0hM3uxy8I2hy2Kqf1NiLif7p6yEgSTKZZjeeiqCHTKIz75Mf5SIrQ== =dZat -----END PGP SIGNATURE----- _______________________________________________ python-de maillist - python-de@python.net http://python.net/mailman/listinfo/python-de
participants (2)
-
Andreas Pakulat
-
Hartmut Goebel