existe wget en python???

joana salgado gomez joana_mendaro en hotmail.com
Mar Nov 21 15:02:12 CET 2006


   Justo esto es lo que necesito hacer(bajarme webs que contnegan una
   palabra determinada, si no puede ser todo a la vez primero me bajo la
   web de la busqueda saco todos los link que tiene parseandola y luego
   me bajo las web que realmente me interesan) pero como ya me lo decia
   jose luis, google me da problemas que puedo hacer para solucionarlos.

   gracias

           datos={"hl":"es","q":"LO QUE QUIERES BUSCAR"}
           params = urllib.urlencode(datos)
           pagina=urlopen(" [1]http://www.google.es/search",params)
           texto=pagina.read()
           pagina.close()

   entre otro codigo html me da este error:

   Your client does not have permission to get URL
   <code>/search?hl=es&amp;q=recetas+de+cocina</code> from this server.
   (Client IP address: 83.32.158.164)<br><br>

   Please see Google's Terms of Service posted at
   http://www.google.com/terms_of_service.html

       ______________________________________________________________

     From:  Jose Luis Dominguez NONLILLY
     <DOMINGUEZ_JOSE_LUIS_NONLILLY en LILLY.COM>
     Reply-To:  La lista de python en castellano <python-es en aditel.org>
     To:  La lista de python en castellano <python-es en aditel.org>
     Subject:  Re: [Python-es] existe wget en python???
     Date:  Mon, 20 Nov 2006 17:22:26 +0100
     >Vas a tener problemas con el google.
     >Ya que detecta que python no es un navegador válido
     >
     >Aun así la idea general es utilizar la librería urllib para
     obtener la
     >página que quieres
     >
     >Para hacer la búsqueda puedes hacer dos cosas
     >codificar tu cadena como http://www.google.es/search?hl=es&q=LO
     QUE QUIERO
     >BUSCAR
     >
     >o utilizar urllib.urlencode()
     >
     >         datos={"hl":"es","q":"LO QUE QUIERES BUSCAR"}
     >         params = urllib.urlencode(datos)
     >         pagina=urlopen(" http://www.google.es/search",params)
     >         texto=pagina.read()
     >         pagina.close()
     >
     >Ahora en texto, (si google no diese problemas) tendrías el código
     de la
     >web que buscas.
     >
     >Ahora solo tendrías que analizarla, para ello te creas una clase
     derivada
     >de SGMLParser o de httpParser (este segundo no estoy seguro de que
     se
     >llame así), que la encuentras en la librería sgmllib
     >
     >                 from sgmllib import SGMLParser
     >y redefines el método  handle_starttag
     >
     >Hay varios ejemplos en internet. Me parece que httpParser es más
     fácil de
     >manejar, échale un ojo.
     >
     >
     >Aunque yo probaría con la librería que te comentaron antes, ya que
     Google
     >te va a dar problemas
     >
     >Un saludo
     >
     >python-es-bounces en aditel.org wrote on 20/11/2006 17:02:42:
     >
     > >
     > >    ok carlos.
     > >
     > >    me lo miro. pero me sabrias decir como llegar hasta esa web
     de google
     > >    donde estaran todas los links que yo me quiero bajar, he
     probado con:
     > >
     > >    file=urlib.urlopen('[1]http://www.google.com. . .' )
     > >    pero no se como seguir para que me baje todas las webs que
     tengan
     > >    alguna receta de cocina.
     > >
     > >    GRACIAS
     >
     >        __________________________________________________________
     ____
     > >
     > >      From:  "Carlos Zuniga" <carlos.zun en gmail.com>
     > >      Reply-To:  La lista de python en castellano
     <python-es en aditel.org>
     > >      To:  "La lista de python en castellano"
     <python-es en aditel.org>
     > >      Subject:  Re: [Python-es] existe wget en python???
     > >      Date:  Mon, 20 Nov 2006 10:50:59 -0500
     > >      >On 11/20/06, joana salgado gomez
     <joana_mendaro en hotmail.com>
     > >      wrote:
     > >      >>
     > >      >>    muchas gracias arrase por la informacion. he estado
     > >      probando  y
     > >      >>    efectivamente se pueden bajr webs siempre y cuando
     le´pases
     > >      la
     > >      >>    direccion exacta que te quieres bajar pero sabes si
     se pueden
     > >      >>bajar
     > >      >>    todas las web que contengan una palabra
     determinada???? es
     > >      >>decir hacer
     > >      >>    busquedas desde python, en linux seria algo asi:
     > >      >>
     > >      >>    lynx --dump
     > >      'http://www.google.com/search?q=recetas+de+cocina'
     > >      >>
     > >      >>
     > >      >>    y se bajaria todas las web que tuvieran recetas de
     cocina en
     > >      su
     > >      >>    contenido.
     > >      >>
     > >      >>
     > >      >>    gracias
     > >      >
     > >      >
     > >      >Si no entiendo mal, lo que quieres es que baje cada link
     que sale
     > >      en
     > >      >google no?. Para eso lo que tienes que hacer es analizar
     la pagina
     > >      >que
     > >      >bajaste y bajar cada link por separado.
     > >      >
     > >      >Prueba BeautifulSoup para analizarla
     > >      >http://www.crummy.com/software/BeautifulSoup/
     > >      >
     > >      >Saludos
     > >      >--
     > >      >(!c) 2006 - ã«ã«ãã¹
     > >      >Linux Registered User # 386081
     > >      >A menudo unas pocas horas de "Prueba y error" podrán
     ahorrarte
     > >      >minutos
     > >      >de leer manuales.
     > >
     > >      >_______________________________________________
     > >      >Python-es mailing list
     > >      >Python-es en aditel.org
     > >      >http://listas.aditel.org/listinfo/python-es
     >
     >      ____________________________________________________________
     _____
     > >
     > >    Excursiones y escapadas a sitios mágicos. [2]No te lo
     pierdas en MSN
     > >    Entretenimiento
     > >
     > > References
     > >
     > >    1. http://www.google.com/
     > >    2. http://g.msn.com/8HMAESES/2734??PS=47575
     > > _______________________________________________
     > > Python-es mailing list
     > > Python-es en aditel.org
     > > http://listas.aditel.org/listinfo/python-es
     >_______________________________________________
     >Python-es mailing list
     >Python-es en aditel.org
     >http://listas.aditel.org/listinfo/python-es
     _________________________________________________________________

   Busca a la vez en Internet, en directorios, en enciclopedias...
   [2]Atrévete con el nuevo MSN Search

References

   1. javascript:ol('http://www.google.es/search');
   2. http://g.msn.com/8HMAESES/2740??PS=47575




Más información sobre la lista de distribución Python-es