Parsear XML o HTML
Daniel González
ikarush en gmail.com
Mar Mar 25 13:19:37 CET 2008
Lei sobre amara, pero mi problema es que estoy haciendo una aplicación y
tiene que ser lo más portable posible, por lo que me gustaría usar las
librerías estandar.
De todas formas ya lo tengo medio resuelto con MiniDom.
Un saludo y gracias a todos.
El día 25/03/08, Luis Miguel Morillas <morillas en gmail.com> escribió:
>
> El 25/03/08, dgonzalez <ikarush en gmail.com> escribió:
>
> > Hola a todos.
> >
> > Estube leyendo la documentación oficial de python (tanto en castellano
> > como en inglés) y no me queda claro como parsear HTML.
> >
> > Lo que quiero estraer es el contenido de una lista con anclas es decir
> >
> > <li><a href="">dato</a></li>
> > <li><a href="">dato</a></li>
> > <li><a href="">dato</a></li>
> > <li><a href="">dato</a></li>
> >
> > metiendo todos esos datos en una lista de python.
> >
> > ¿Alguien me puede colgar scripts, que realizen algo parecido?.
> >
> > A ser posible, me gustaría que fuera utilizando DOM.
> >
> > Un saludo y gracias por todo.
> >
>
>
> Con xml usa amara, sin duda. Con html, usa un tagsoup+amara o similar.
> Para instalar amara $ sudo easy_install amara
> Ejemplos de uso y documentación: http://wiki.xml3k.org/Amara
>
> Y si tienes dudas, pregunta :-)
>
> -- lm
>
>
> >
> > _______________________________________________
> > Lista de correo Python-es
> > http://listas.aditel.org/listinfo/python-es
> > FAQ: http://listas.aditel.org/faqpyes
> >
> _______________________________________________
> Lista de correo Python-es
> http://listas.aditel.org/listinfo/python-es
> FAQ: http://listas.aditel.org/faqpyes
>
--
Daniel Gonzalez Cerviño
tel 653965048
ikarush en gmail.com
_______________________________________________
Lista de correo Python-es
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes
Más información sobre la lista de distribución Python-es