existe wget en python???

Jose Luis Dominguez NONLILLY DOMINGUEZ_JOSE_LUIS_NONLILLY en LILLY.COM
Lun Nov 20 17:22:26 CET 2006


Vas a tener problemas con el google.
Ya que detecta que python no es un navegador válido

Aun así la idea general es utilizar la librería urllib para obtener la 
página que quieres

Para hacer la búsqueda puedes hacer dos cosas
codificar tu cadena como http://www.google.es/search?hl=es&q=LO QUE QUIERO 
BUSCAR

o utilizar urllib.urlencode()

        datos={"hl":"es","q":"LO QUE QUIERES BUSCAR"}
        params = urllib.urlencode(datos)
        pagina=urlopen(" http://www.google.es/search",params)
        texto=pagina.read()
        pagina.close()

Ahora en texto, (si google no diese problemas) tendrías el código de la 
web que buscas.

Ahora solo tendrías que analizarla, para ello te creas una clase derivada 
de SGMLParser o de httpParser (este segundo no estoy seguro de que se 
llame así), que la encuentras en la librería sgmllib

                from sgmllib import SGMLParser
y redefines el método  handle_starttag

Hay varios ejemplos en internet. Me parece que httpParser es más fácil de 
manejar, échale un ojo.


Aunque yo probaría con la librería que te comentaron antes, ya que Google 
te va a dar problemas

Un saludo

python-es-bounces en aditel.org wrote on 20/11/2006 17:02:42:

> 
>    ok carlos.
> 
>    me lo miro. pero me sabrias decir como llegar hasta esa web de google
>    donde estaran todas los links que yo me quiero bajar, he probado con:
> 
>    file=urlib.urlopen('[1]http://www.google.com. . .' )
>    pero no se como seguir para que me baje todas las webs que tengan
>    alguna receta de cocina.
> 
>    GRACIAS
>        ______________________________________________________________
> 
>      From:  "Carlos Zuniga" <carlos.zun en gmail.com>
>      Reply-To:  La lista de python en castellano <python-es en aditel.org>
>      To:  "La lista de python en castellano" <python-es en aditel.org>
>      Subject:  Re: [Python-es] existe wget en python???
>      Date:  Mon, 20 Nov 2006 10:50:59 -0500
>      >On 11/20/06, joana salgado gomez <joana_mendaro en hotmail.com>
>      wrote:
>      >>
>      >>    muchas gracias arrase por la informacion. he estado
>      probando  y
>      >>    efectivamente se pueden bajr webs siempre y cuando le´pases
>      la
>      >>    direccion exacta que te quieres bajar pero sabes si se pueden
>      >>bajar
>      >>    todas las web que contengan una palabra determinada???? es
>      >>decir hacer
>      >>    busquedas desde python, en linux seria algo asi:
>      >>
>      >>    lynx --dump
>      'http://www.google.com/search?q=recetas+de+cocina'
>      >>
>      >>
>      >>    y se bajaria todas las web que tuvieran recetas de cocina en
>      su
>      >>    contenido.
>      >>
>      >>
>      >>    gracias
>      >
>      >
>      >Si no entiendo mal, lo que quieres es que baje cada link que sale
>      en
>      >google no?. Para eso lo que tienes que hacer es analizar la pagina
>      >que
>      >bajaste y bajar cada link por separado.
>      >
>      >Prueba BeautifulSoup para analizarla
>      >http://www.crummy.com/software/BeautifulSoup/
>      >
>      >Saludos
>      >--
>      >(!c) 2006 - ã«ã«ãã¹
>      >Linux Registered User # 386081
>      >A menudo unas pocas horas de "Prueba y error" podrán ahorrarte
>      >minutos
>      >de leer manuales.
> 
>      >_______________________________________________
>      >Python-es mailing list
>      >Python-es en aditel.org
>      >http://listas.aditel.org/listinfo/python-es
>      _________________________________________________________________
> 
>    Excursiones y escapadas a sitios mágicos. [2]No te lo pierdas en MSN
>    Entretenimiento
> 
> References
> 
>    1. http://www.google.com/
>    2. http://g.msn.com/8HMAESES/2734??PS=47575
> _______________________________________________
> Python-es mailing list
> Python-es en aditel.org
> http://listas.aditel.org/listinfo/python-es




Más información sobre la lista de distribución Python-es