Parseador HTML en Python

Juan Pablo Lopez Franco jlopezfranco en gmail.com
Mar Jul 4 09:40:36 CEST 2006


Hola a todos,

Me llamo Juan Pablo y es la primera vez que escribo en la lista. Tengo
que hacer un parser en Python que añada o borre marcadores de Firefox.
Estos marcadores vienen dados en un fichero bookmarks.html.

Mi idea era recorrer este html y guardarlo en una estructura de arbol
para comparar con los enlaces que quiero añadir/borrar

He encontrado un modulo llamado HTMLParser pero me da fallos porque el
fichero bookmarks.html no esta vien formado (algunas etiquetas como DT
se abren pero no se cierran).

Tambien he encontrado una herramienta que añade los marcadores de
Firefox a delicious pero estoy bastante verde en Python y me cuesta
entender algunas cosas. Aqui os dejo el enlace:

http://sourceforge.net/projects/bkmrk2dlcs/

A ver si podeis echarme una mano, tanto si conoceis alguna herramienta
que ya haga esto como si se os ocurre otra manera de hacerlo

Muchas gracias!




Más información sobre la lista de distribución Python-es