Parseador HTML en Python

Hernan Martinez Foffani hernan en orgmf.com.ar
Mar Jul 4 10:00:01 CEST 2006


> Me llamo Juan Pablo y es la primera vez que escribo en la lista. Tengo
> que hacer un parser en Python que añada o borre marcadores de Firefox.
> Estos marcadores vienen dados en un fichero bookmarks.html.
>
> Mi idea era recorrer este html y guardarlo en una estructura de arbol
> para comparar con los enlaces que quiero añadir/borrar
>
> He encontrado un modulo llamado HTMLParser pero me da fallos porque el
> fichero bookmarks.html no esta vien formado (algunas etiquetas como DT
> se abren pero no se cierran).

El HTMLParser es estricto.  ¿Has probado Beautiful Soup?
http://www.crummy.com/software/BeautifulSoup/

-H.
------------ próxima parte ------------
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es


Más información sobre la lista de distribución Python-es