[Python-es] comparar ngramas de longitud > 1
Antonio Reyes
areyespgil en gmail.com
Vie Feb 26 13:48:19 CET 2010
hola,
tengo el siguiente problema y espero me puedan orientar para resolverlo.
quiero comparar ngramas cuya longitud sea mayor a una palabra. es decir,
tengo un documento N con ngramas del tipo:
n n
n v
n v n j
y varios documentos D que los contienen.
mi pregunta es cómo puedo hacer un programa que dada cualquiera de las
secuencias de N, por ejemplo n v n j,
identifique si la misma secuencia está en D.
con secuencias = 1 no tengo problemas porque lo hago mediante
diccionarios, la cuestión es cuando las secuencias superan ese valor.
algún consejo?
gracias de antemano,
antonio
--
Usando el novísimo cliente de correo de Opera: http://www.opera.com/mail/
Más información sobre la lista de distribución Python-es