[Python-es] difflib utilizado para páginas web
Milton Galo Patricio Inostroza Aguilera
minoztro en gmail.com
Jue Ene 6 23:20:12 CET 2011
Estimad en s:
Me han pedido poder notificar a los usuarios de los cambios que sufren
algunas paginas web de forma periodica (inserción, eliminacion,
modificación). Estoy utilizando difflib para hacer esta tarea, pero a
veces tengo comportamientos errones, es decir, existen veces que
cuando ciertas columnas se parecen (version antigua v/s nueva)
simplemente no me marca ningún cambio :-S.
Estoy utilizando de esta manera la librería:
diff_texto(codecs.open(antiguo).read().splitlines(),codecs.open(nuevo).read().splitlines())
donde diff_texto es la función que hace el trabajo real:
s = difflib.SequenceMatcher(None, antiguo, nuevo)
for e in s.get_opcodes():
...bla...
lo extraño es que si utilizo unified_diff o el HtmlDiff si me muestra
los cambios correctos...alguien se ha topado con este tipo de
problemas?, saludos!
--
Milton
Más información sobre la lista de distribución Python-es