[Python-es] parsear HTML
Nekmo
contacto en nekmo.com
Mie Mar 2 15:31:41 CET 2011
Tienes un módulo con Python llamado así, HTMLParser. A mí
personalmente no me gusta demasiado, y no mantiene el árbol como
debería... pero para lo que quieres puede valerte. Hay un módulo que
me encanta (no está en Core) llamado lxml que también soporta HTML. Te
recomiendo echarle un ojo ;-)
Un cordial saludo:
-- Nekmo.
Sitio web: http://nekmo.com
Dirección de contacto: contacto en nekmo.com
XMPP/Jabber: contacto en nekmo.com
Identi.ca: http://identi.ca/nekmo
Diaspora: Nekmo
El día 2 de marzo de 2011 15:23, (P en vel) <pdlopez en uci.cu> escribió:
> Como puedo de un archivo html cojer todas las etiquetas <tr></tr> que tengan
> un <td></td> que se llame cuentos infantiles por ejemplo, y guardar el valor
> que tenga los demas <td> de ese <tr>, es decir cojer los valores de todas
> las columnas de esa fila, por ejemplo: cenicienta, 25.00
>
> <tr align="RIGHT" bgcolor="#ffffff">
> <td nowrap="nowrap" align="center">Cuentos Infantiles</td>
> <td><font color="#008000">Cenicienta</font></td>
> <td><font color="#008000">25.00</font></td>
> </tr>
>
> _______________________________________________
> Python-es mailing list
> Python-es en python.org
> http://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>
>
Más información sobre la lista de distribución Python-es