Leyendo HTML mal formado

Francisco Perez francofuji en gmail.com
Lun Mar 3 16:35:55 CET 2008


Existe alguna manera de leer (parsear) HTML mal formado? Digamos que
los generados por MS Word? Hasta ahora use SAX y DOM y con ambos
obtuve un.."not well-formed (invalid token): line 6, column 17"

Saludos..
_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes





Más información sobre la lista de distribución Python-es