Re: que==Qué
Gabriel Genellina
gagsl-py2 en yahoo.com.ar
Lun Abr 23 19:39:49 CEST 2007
En Mon, 23 Apr 2007 13:47:08 -0300, Antonio Beamud Montero
<antonio.beamud en linkend.net> escribió:
> El lun, 23-04-2007 a las 13:34 -0300, Gabriel Genellina escribió:
>> def soloascii(uni):
>> ... assert isinstance(uni, unicode)
>> ... return unicodedata.normalize("NFKD",
>> uni).encode("ascii","ignore")
>> ...
>
> Pero esto es erroneo, por ejemplo:
>
> moño no es mono (por no poner otro ejemplo :)
> Hay palabras que se pueden "aplanar" pero otras cambian totalmente de
> significado...
Y "qué" no es "que", pero eso es lo que se pedía originalmente.
Supongo que la idea no es comparar palabras al azar, sino encontrar
valores posiblemente iguales entre fuentes distintas. Especialmente en
bases de datos un tanto viejas, los textos no siempre fueron ingresados
con acentos.
Una forma menos drástica es usar xxx.translate(tabla) donde la tabla se
armó con string.maketrans("áéíóúüÁÉÍÓÚÜ","aeiouuAEIOUU"), esto quitaría
los acentos usados en castellano nada más, manteniendo cosas como ñ,ç,à,
etc. sin cambios.
--
Gabriel Genellina
------------ próxima parte ------------
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
Más información sobre la lista de distribución Python-es