[Python-es] Convertir utf8 a html entities
Luis Miguel Morillas
morillas en gmail.com
Mar Jun 5 20:29:24 CEST 2012
El día 5 de junio de 2012 13:53, Raimon Esteve
<raimonesteve en gmail.com> escribió:
> Hola,
>
> he leido de todo y nada me ha gustado. Como convertís un string utf8 a
> un string con carácteres html? o sea, que los accentos se transformen
> a codificación html?
>
> En este pequeño código, convertimos á é í ó ú ñ -> a htm entities.
> Pero falta mayúsculas, ç (catalán), ....
>
Yo uso un parser de xml/html y un writer para HTML
>>> from amara.bindery import html
>>> from amara.writers import lookup
>>> HTML_W = lookup("html")
>>> doc = html.parse('<p>Caña áéíóú ç</p>')
>>> doc.xml_encode(HTML_W)
'<html><head></head><body><p>Caña
áéíóú ç</p></body></html>'
Saludos,
-- luismiguel (@lmorillas)
> import re
>
> value u'Camión'
>
> value = re.sub(r'\xe1', "á", value)
> value = re.sub(r'\xe9', "é", value)
> value = re.sub(r'\xed', "í", value)
> value = re.sub(r'\xf3', "ó", value)
> value = re.sub(r'\xfa', "ú", value)
> value = re.sub(r'\xf1', "ñ", value)
>
> --
> Si us plau, NO adjunti arxius a les seves respostes. Li preguem que
> integri el text al cos del missatge. Pot respondre usant NetEtiquete
> que li ajudarà a seguir la conversa.
> http://es.wikipedia.org/wiki/Netiquette
>
> Por favor, NO adjunte archivos a sus respuestas. Le rogamos que
> integre el texto en el cuerpo del mensaje. Puede responder usando
> NetEtiquete que le ayudará a seguir la
> conversación.http://es.wikipedia.org/wiki/Netiquette
>
> Please, DO NOT send attachment files with your answers, just copy and
> paste only the text you need to send into the body of your mails.
> Repply using NetEtiquete. http://en.wikipedia.org/wiki/Netiquette
> _______________________________________________
> Python-es mailing list
> Python-es en python.org
> http://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
Más información sobre la lista de distribución Python-es