Parsear XML o HTML

Daniel González ikarush en gmail.com
Mar Mar 25 13:19:37 CET 2008


Lei sobre amara, pero mi problema es que estoy haciendo una aplicación y
tiene que ser lo más portable posible, por lo que me gustaría usar las
librerías estandar.

De todas formas ya lo tengo medio resuelto con MiniDom.

Un saludo y gracias a todos.

El día 25/03/08, Luis Miguel Morillas <morillas en gmail.com> escribió:
>
> El 25/03/08, dgonzalez <ikarush en gmail.com> escribió:
>
> > Hola a todos.
> >
> >  Estube leyendo la documentación oficial de python (tanto en castellano
> >  como en inglés) y no me queda claro como parsear HTML.
> >
> >  Lo que quiero estraer es el contenido de una lista con anclas es decir
> >
> >  <li><a href="">dato</a></li>
> >  <li><a href="">dato</a></li>
> >  <li><a href="">dato</a></li>
> >  <li><a href="">dato</a></li>
> >
> >  metiendo todos esos datos en una lista de python.
> >
> >  ¿Alguien me puede colgar scripts, que realizen algo parecido?.
> >
> >  A ser posible, me gustaría que fuera utilizando DOM.
> >
> >  Un saludo y gracias por todo.
> >
>
>
> Con xml usa amara, sin duda. Con html, usa un tagsoup+amara o similar.
> Para instalar amara $ sudo easy_install amara
> Ejemplos de uso y documentación:  http://wiki.xml3k.org/Amara
>
> Y si tienes dudas, pregunta :-)
>
> -- lm
>
>
> >
> > _______________________________________________
> >  Lista de correo Python-es
> >  http://listas.aditel.org/listinfo/python-es
> >  FAQ: http://listas.aditel.org/faqpyes
> >
> _______________________________________________
> Lista de correo Python-es
> http://listas.aditel.org/listinfo/python-es
> FAQ: http://listas.aditel.org/faqpyes
>



-- 



Daniel Gonzalez Cerviño
tel 653965048
ikarush en gmail.com
_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes





Más información sobre la lista de distribución Python-es