Filtrado de cadenas
Jordi Funollet
jordi.f en ati.es
Vie Mayo 5 15:50:30 CEST 2006
> Si descargo el codigo fuente de una web con urlopen y meto todas sus
> lineas en una lista, ¿cual es la manera mas eficiente de extraer solo
> las que contienen enlaces a otras webs?
Python tiene una libreria justo para eso, y ni tan solo necesitas meterlo en
una lista. Te serviria algo asi?
###########################################################
#!/usr/bin/env python
import sys, HTMLParser
class GetUrlParser (HTMLParser.HTMLParser):
def handle_starttag (self, tag, attrs):
if tag=='a':
print attrs[0][1]
html = sys.stdin.read()
GetUrlParser().feed(html)
###########################################################
--
##############################
### Jordi Funollet
### http://www.terraquis.net
------------ próxima parte ------------
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
Más información sobre la lista de distribución Python-es