[Python-es] OT Detectar similitud de datos

Hector Garcia hectorogarcia en gmail.com
Vie Nov 22 00:56:14 CET 2013


El día 21 de noviembre de 2013 10:13, Miguel Beltran R.
<yourpadre en gmail.com> escribió:
> Hola lista,
>
> En mi trabajo me pidieron que hiciera un sistema que detectara similitud en
> unos datos para revisar que no nos esten engañando. Se supone que con un
> analizador se toman lecturas de diferentes vehiculos pero en ocasiones
> ciertas personas usan un mismo vehiculo para ser analizado en lugar del que
> se capturo, es decir en lugar los datos de V1, V2 y V3 tengo realmente los
> datos V1, V1 y V1. Los datos nunca son iguales pero si son similares.
>
> La estructura de los datos es basicamente así:
>
> campo - valor - descripcion
> ID - 1 - quien genera los datos (unos 600 analizadores)
> año - 2007 - año del vehiculo que se supone se esta midiendo. Mayor año,
> menor el valor de a1.
> modelo - UNO - identificador del vehiculo
> a1 - 11.0 - dato1
> b1 - 0.03 - dato2
> c1 - 14.9 - dato3
> d1 - 0.30 - dato4
> a2 - 13.0 - dato1 medido en otras condiciones
> b2 - 0.04 - dato2 medido en otras condiciones
> c2 - 14.8 - dato3 medido en otras condiciones
> d2 - 0.30 - dato4 medido en otras condiciones
>
>
> Alguien que me pueda dar una pista de como hacer esto
>
> Gracias de antemano.
>
> --


Hola

Si tus datos de a1..d2 son reales, no les veo un parámetro de cambio
proporcional, esto es, si a2 aumenta en 2 unidades con respecto a a1,
el cambio se vería proporcionalmente en d2 vs d1. Esto no ocurre, lo
que, te obligaría a hacer tus comparaciones por métodos estadísticos.

Tiro al aire

Primero, arrastrar el lápiz: podrías calcular la varianza ( o, si
aplica, la desviación estándar) de una muestra completa de datos,
establecer un criterio de máximos y mínimos.

Antes de sentarte a codificar en pyton, podrías hacer éste análisis en
una hoja de calculo, y después generar tu algoritmo a codificar.


Saludos
-- 
Hector
--
El Pic no pudo Iniciar correctamente.
Inserte el disco de arranque y presione cualquier pin para continuar...

Linux Registered User #467500
https://linuxcounter.net/user/467500.html


Más información sobre la lista de distribución Python-es