Conviertiendo caracteres Html

Chema Cortes pych3m4 en gmail.com
Mar Dic 19 12:07:27 CET 2006


El 19/12/06, Oscar de Anda<oscar en jornada.com.mx> escribió:
> Gracias Chema, te explico brevemente.....
>
> Estamos realizando un programa que genera un Xml basado en el estándar
> Nitf (nitf.org) a partir de un archivo que se exporta desde InDesign, un
> archivo con un formato similar pero muy complejo al Xml.
>
> Para la unidad de pruebas, generamos un par de archivos tal y como se
> supone que los debería de generar , los parseamos con miniDom y los
> comparamos con cada uno de los valores que retornan las funciones del
> programa.
>
> El problema que tenemos es que miniDom convierte la entidad en el
> caracter mientras que las funciones del programa regresan la entidad lo
> que hace que la unidad de pruebas falle.
>
> Con la expresión regular que mencioné anteriormente se solucionó la
> conversión de algunas entidades haciendo que la unidad de pruebas pase,
> pero me encontré con &apos; y quiero encontrar alguna función o módulo
> que me permita convertir también este tipo de entidades que, como
> mencionas y yo no sabía, son entidades Xml.

Bueno, si revisas algunos de los mensajes anteriores de la lista verás
que estamos de "promoción" del Amara/4Suite. Prueba con él a ver si te
sirve para las pruebas:

import amara

doc=amara.parse("<span>entidades &apos; y &amp;</span>")
s_convertida=str(doc.span)



PD: se puede instalar fácilmente a través del "easy_install"




Más información sobre la lista de distribución Python-es