Problema con htmlParser y expresiones regulares
Joan Carles Jimenez
jjcarles en terra.es
Mar Mayo 29 15:37:35 CEST 2007
Hola Jordi
Me he estado mirando el link que me has pasado al igual que me he mirado el
htmltidy, pero he sido incapaz de extraer los links que me interesan. Supongo
que el problema sigue siendo la expresión regular. De todas maneras me
interesa hacerlo sin utilizar herramientas de terceros en todo lo que pueda.
Por eso preguntaba si la manera que lo hacia yo era correcta.
Gracias por contestar.
On Tuesday 29 May 2007 12:32, Jordi Funollet wrote:
> Joan Carles Jimenez dixit:
> > Hola.
> >
> > Estoy utilizando el htmlParser para extraer los links a los que hace
> > referencia una web. El problema lo tengo en que, segun he leido, el
> > htmlParser no soporta muy bien el código script.
>
> Yo para estas cosas estoy encantado con el BeautifoulSoup: es a prueba de
> manazas como yo.
>
> http://www.crummy.com/software/BeautifulSoup/
--
Joan Carles Jimenez
jjcarles en terra.es
Más información sobre la lista de distribución Python-es