Parsear XML o HTML
Luis Miguel Morillas
morillas en gmail.com
Mar Mar 25 11:50:59 CET 2008
El 25/03/08, dgonzalez <ikarush en gmail.com> escribió:
> Hola a todos.
>
> Estube leyendo la documentación oficial de python (tanto en castellano
> como en inglés) y no me queda claro como parsear HTML.
>
> Lo que quiero estraer es el contenido de una lista con anclas es decir
>
> <li><a href="">dato</a></li>
> <li><a href="">dato</a></li>
> <li><a href="">dato</a></li>
> <li><a href="">dato</a></li>
>
> metiendo todos esos datos en una lista de python.
>
> ¿Alguien me puede colgar scripts, que realizen algo parecido?.
>
> A ser posible, me gustaría que fuera utilizando DOM.
>
> Un saludo y gracias por todo.
>
Con xml usa amara, sin duda. Con html, usa un tagsoup+amara o similar.
Para instalar amara $ sudo easy_install amara
Ejemplos de uso y documentación: http://wiki.xml3k.org/Amara
Y si tienes dudas, pregunta :-)
-- lm
>
> _______________________________________________
> Lista de correo Python-es
> http://listas.aditel.org/listinfo/python-es
> FAQ: http://listas.aditel.org/faqpyes
>
_______________________________________________
Lista de correo Python-es
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes
Más información sobre la lista de distribución Python-es