<html><head><style type='text/css'>p { margin: 0; }</style></head><body><div style='font-family: Times New Roman; font-size: 12pt; color: #000000'> "Chema Cortes" <pych3m4@gmail.com> Escribio:<br><br>Vamos a ver si aclaramos algunos conceptos sobre este problema:<br><br>1) python puede trabajar "nativamente" con unicode, algo que luego debe <br>codificarse según requiera la salida por la terminal. Por tanto, lo <br>primero es averiguar qué codificación usa la terminal<br><br>2) los ficheros de código pueden haberse codificado en cualquier sistema <br>de codificación. La codificación utf puede usar una marca al principio del <br>fichero para indicarlo, pero algunos editores de texto no saben manejarlas <br>y es mejor no usarlas. Por tanto, lo segundo es indicar con un comentario <br>(primera o segunda línea) en qué sistema de codificación está creado el <br>fichero. Este comentario únicamente influye en cómo se interpretarán los <br>literales unicode en el código (Los que aparecen como u".."). El resto del <br>funcionamiento no se ve afectado (ya he dicho que python usa unicode <br>"nativamente" (aka como "codepoints").<br><br>3) si vamos a leer ficheros de texto que no sean en ascii, se deben abrir <br>con 'codecs.open'<br><br><br>Si seguimos con problemas, probar con éste código (codificado en ascii):<br><br>print u"Espa\N{LATIN SMALL LETTER N WITH TILDE}a"<br><br>Si da error o no se lee "España" correctamente entonces tu problema NO ES <br>DE PYTHON.<br><br>***************************************************************************************************<br>A ver yo lo que estoy haciendo es cojer el html de una pagina de internet con :<br>f = urllib2.urlopen(url_page) <br>data = f.read()<br>mi problema es que cuando parseo esto con BeautifulSoup puedo obtener cosas como esto [u'ESPAÑA'] y necesito convertir eso que esta en la lista a un str, para poder meterlo en un campo de una tabla en mi base de datos<br><br>ya probe con hacer esto dentro de mi funcion<br>def get_html(url_page="http://www.bolsamadrid.es/esp/mercados/fondos/htm/trenta100.htm"):<br> proxy_h = urllib2.ProxyHandler({"http" : "http://pdlopez@hlg.uci.cu:paveling84074@100.0.0.1:3128"}) <br> opener = urllib2.build_opener(proxy_h) <br> urllib2.install_opener(opener) <br> f = urllib2.urlopen(url_page) <br> <br> data = f.read()<br> data = codecs.open(data) #Esto<br> return data<br>y me saca todo el codigo de la pagina y la otra funcion a la cual le paso lo que tengo en data, ahora no hace nada<br><br></div></body></html>