[Python-es] difflib utilizado para páginas web

Milton Galo Patricio Inostroza Aguilera minoztro en gmail.com
Jue Ene 6 23:20:12 CET 2011


Estimad en s:

Me han pedido poder notificar a los usuarios de los cambios que sufren
algunas paginas web de forma periodica (inserción, eliminacion,
modificación).  Estoy utilizando difflib para hacer esta tarea, pero a
veces tengo comportamientos errones, es decir, existen veces que
cuando ciertas columnas se parecen (version antigua v/s nueva)
simplemente no me marca ningún cambio :-S.

Estoy utilizando de esta manera la librería:

diff_texto(codecs.open(antiguo).read().splitlines(),codecs.open(nuevo).read().splitlines())

donde diff_texto es la función que hace el trabajo real:

s = difflib.SequenceMatcher(None, antiguo, nuevo)
    for e in s.get_opcodes():
      ...bla...


lo extraño es que si utilizo unified_diff o el HtmlDiff si me muestra
los cambios correctos...alguien se ha topado con este tipo de
problemas?, saludos!



-- 
Milton


Más información sobre la lista de distribución Python-es