[Python-es] parsear HTML

Mie Mar 2 15:31:41 CET 2011

Tienes un módulo con Python llamado así, HTMLParser. A mí
personalmente no me gusta demasiado, y no mantiene el árbol como
debería... pero para lo que quieres puede valerte. Hay un módulo que
me encanta (no está en Core) llamado lxml que también soporta HTML. Te
recomiendo echarle un ojo ;-)

Un cordial saludo:
-- Nekmo.

Sitio web: http://nekmo.com
Dirección de contacto: contacto en nekmo.com
XMPP/Jabber: contacto en nekmo.com
Identi.ca: http://identi.ca/nekmo
Diaspora: Nekmo

El día 2 de marzo de 2011 15:23, (P en vel) <pdlopez en uci.cu> escribió:
> Como puedo de un archivo html cojer todas las etiquetas <tr></tr> que tengan
> un <td></td> que se llame cuentos infantiles por ejemplo, y guardar el valor
> que tenga los demas <td> de ese <tr>, es decir cojer los valores de todas
> las columnas de esa fila, por ejemplo: cenicienta, 25.00
>
> <tr align="RIGHT" bgcolor="#ffffff">
> <td nowrap="nowrap" align="center">Cuentos Infantiles</td>
> <td><font color="#008000">Cenicienta</font></td>
> <td><font color="#008000">25.00</font></td>
> </tr>
>
> _______________________________________________
> Python-es mailing list
> Python-es en python.org
> http://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>
>