<html><head><style type='text/css'>p { margin: 0; }</style></head><body><div style='font-family: Times New Roman; font-size: 12pt; color: #000000'>&nbsp;"Chema Cortes" &lt;pych3m4@gmail.com&gt;&nbsp; Escribio:<br><br>Vamos a ver si aclaramos algunos conceptos sobre este problema:<br><br>1) python puede trabajar "nativamente" con unicode, algo que luego debe &nbsp;<br>codificarse según requiera la salida por la terminal. Por tanto, lo &nbsp;<br>primero es averiguar qué codificación usa la terminal<br><br>2) los ficheros de código pueden haberse codificado en cualquier sistema &nbsp;<br>de codificación. La codificación utf puede usar una marca al principio del &nbsp;<br>fichero para indicarlo, pero algunos editores de texto no saben manejarlas &nbsp;<br>y es mejor no usarlas. Por tanto, lo segundo es indicar con un comentario &nbsp;<br>(primera o segunda línea) en qué sistema de codificación está creado el &nbsp;<br>fichero. Este comentario únicamente influye en cómo se interpretarán los &nbsp;<br>literales unicode en el código (Los que aparecen como u".."). El resto del &nbsp;<br>funcionamiento no se ve afectado (ya he dicho que python usa unicode &nbsp;<br>"nativamente" (aka como "codepoints").<br><br>3) si vamos a leer ficheros de texto que no sean en ascii, se deben abrir &nbsp;<br>con 'codecs.open'<br><br><br>Si seguimos con problemas, probar con éste código (codificado en ascii):<br><br>print u"Espa\N{LATIN SMALL LETTER N WITH TILDE}a"<br><br>Si da error o no se lee "España" correctamente entonces tu problema NO ES &nbsp;<br>DE PYTHON.<br><br>***************************************************************************************************<br>A ver yo lo que estoy haciendo es cojer el html de una pagina de internet con :<br>f = urllib2.urlopen(url_page) <br>data = f.read()<br>mi problema es que cuando parseo esto con BeautifulSoup puedo obtener cosas como esto [u'ESPAÑA'] y necesito convertir eso que esta en la lista a un str, para poder meterlo en un campo de una tabla en mi base de datos<br><br>ya probe con hacer esto dentro de mi funcion<br>def get_html(url_page="http://www.bolsamadrid.es/esp/mercados/fondos/htm/trenta100.htm"):<br>&nbsp;&nbsp;&nbsp; proxy_h = urllib2.ProxyHandler({"http" : "http://pdlopez@hlg.uci.cu:paveling84074@100.0.0.1:3128"})&nbsp; <br>&nbsp;&nbsp;&nbsp; opener = urllib2.build_opener(proxy_h)&nbsp; <br>&nbsp;&nbsp;&nbsp; urllib2.install_opener(opener)&nbsp; <br>&nbsp;&nbsp;&nbsp; f = urllib2.urlopen(url_page) <br>&nbsp;&nbsp; <br>&nbsp;&nbsp;&nbsp; data = f.read()<br>&nbsp;&nbsp;&nbsp; data = codecs.open(data) #Esto<br>&nbsp;&nbsp;&nbsp; return data<br>y me saca todo el codigo de la pagina y la otra funcion a la cual le paso lo que tengo en data, ahora no hace nada<br><br></div></body></html>