Filtrado de cadenas

Jordi Funollet jordi.f en ati.es
Vie Mayo 5 15:50:30 CEST 2006


> Si descargo el codigo fuente de una web con urlopen y meto todas sus
> lineas en una lista, ¿cual es la manera mas eficiente de extraer solo
> las que contienen enlaces a otras webs?

Python tiene una libreria justo para eso, y ni tan solo necesitas meterlo en 
una lista. Te serviria algo asi?

###########################################################
#!/usr/bin/env python

import sys, HTMLParser

class GetUrlParser (HTMLParser.HTMLParser):
    def handle_starttag (self, tag, attrs):
        if tag=='a':
            print attrs[0][1]


html = sys.stdin.read()
GetUrlParser().feed(html)
###########################################################


-- 
##############################
### Jordi Funollet
### http://www.terraquis.net
------------ próxima parte ------------
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es


Más información sobre la lista de distribución Python-es