[Python-es] difflib utilizado para páginas web
Luis Miguel Morillas
morillas en gmail.com
Vie Ene 7 19:51:22 CET 2011
Yo utilizo amara para parserar html. Para comparar documentos o
subnodos utilizo las funciones de {{{amara.lib.treecompare}}} que
permiten ignorar aspectos no significativos de los nodos (espacios en
blanco, orden de atributos, espacios de nombres ...)
Saludos,
--
Luis Miguel
El día 7 de enero de 2011 16:02, Eli Bendersky <eliben en gmail.com> escribió:
> difflib tiene un "bug" en Python 2.6 y 3.1 (mira el
> http://bugs.python.org/issue2986) que puede causar los problemas que tienes.
> En Python 2.7 y 3.2 hay un parametro nuevo en difflib.SequenceMatcher que
> puede eliminar el "bug".
>
> Eli
>
>
>
>
> 2011/1/7 Milton Galo Patricio Inostroza Aguilera <minoztro en gmail.com>
>>
>> Estimad en s:
>>
>> Me han pedido poder notificar a los usuarios de los cambios que sufren
>> algunas paginas web de forma periodica (inserción, eliminacion,
>> modificación). Estoy utilizando difflib para hacer esta tarea, pero a
>> veces tengo comportamientos errones, es decir, existen veces que
>> cuando ciertas columnas se parecen (version antigua v/s nueva)
>> simplemente no me marca ningún cambio :-S.
>>
>> Estoy utilizando de esta manera la librería:
>>
>>
>> diff_texto(codecs.open(antiguo).read().splitlines(),codecs.open(nuevo).read().splitlines())
>>
>> donde diff_texto es la función que hace el trabajo real:
>>
>> s = difflib.SequenceMatcher(None, antiguo, nuevo)
>> for e in s.get_opcodes():
>> ...bla...
>>
>>
>> lo extraño es que si utilizo unified_diff o el HtmlDiff si me muestra
>> los cambios correctos...alguien se ha topado con este tipo de
>> problemas?, saludos!
>>
>>
>>
>> --
>> Milton
>> _______________________________________________
>> Python-es mailing list
>> Python-es en python.org
>> http://mail.python.org/mailman/listinfo/python-es
>> FAQ: http://python-es-faq.wikidot.com/
>
>
> _______________________________________________
> Python-es mailing list
> Python-es en python.org
> http://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>
>
Más información sobre la lista de distribución Python-es