Duda de parser texto o html..

Ignacio Quezada dreamtrick en gmail.com
Lun Jun 23 13:15:58 CEST 2008


Buenas! Tengo un pequeño problema de recursos jeje. Estoy intentando
conseguir cierta información de una pagina web a travez de python.
Consigo extraer la pagina en html con:

#!/usr/bin/python
import urllib, re

# Get something to work with.
f = urllib.urlopen("http://www.paginaweb.com")
s = f.read()
print s

Entonces se que tengo la página en s pero claro, ahora me interesa sacar
unos datos concretos, no guardar la pagina entera.
Para ello pensé que lo mejor era usar un htmlparser pero creo que estoy
en lo erroneo. Entonces, ¿un SimpleParser o algo asi? En cualquiera de
los casos he intentado buscar información sobre los 2 metodos y he
encontrado informacion muy muy escasa y nose que hacer.
Lo que me interesa hacer es algo como esto:

<DIV CLASS=encyc-info-type>
<STRONG>texto1:</STRONG> 
	<SPAN>texto2</SPAN>
</DIV>

Conseguir el "texto2" y guardarlo en una variable "texto1", da igual
cual sea el nombre en realidad. 

¿Alguna veterano porfavor?, Gracias.

------------ próxima parte ------------
_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes


Más información sobre la lista de distribución Python-es