Modificación a HTMLParser.py
diego arias
diego.arias en gmail.com
Mar Dic 18 20:32:46 CET 2007
Hola mi nombre es Diego, les cuento mi situación, en una de las paginas de
un sitio con el que trabajo, existe un componente wysiwyg, de donde luego
recupero el contenido, este contenido viene con todos los tags de html y mi
necesidad era en un lugar guardarlo con esos tags para luego mostrarlo
igual, pero tambien mandar por correo solo el texto sin los tags. Para esto
use HTMLParser pero contaba con algunas dificultades para conseguir
asignarle a una variable el valor del texto.
La solucion fue cambiar la clase HTMLParser de modo que su funcionamiento
sea simple y efectivo, basta con esto:
import HTMLParser
class ParsearHTML (HTMLParser.HTMLParser):
def __init__(self,datos):
HTMLParser.HTMLParser.__init__(self)
self.feed(datos)
self.close()
def handle_data(self,data):
return data
parser = ParsearHTML(html)
data = parser.feed(html)
#html es la variable en donde tenia el texto con sus tags,
como resultado, en la variable data, se encuentra el texto ya sin los tags
html.
Les adjunto una copia de como quedo la clase HTMLParser luego de las
modificaciones,
Espero que les sirva.
Sino igualmente haganme saber su opinion.
Muchas Gracias por su constante apoyo.
Un Abrazo.
Diego.
------------ próxima parte ------------
_______________________________________________
Lista de correo Python-es
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes
Más información sobre la lista de distribución Python-es