[Python-es] comparar ngramas de longitud > 1

Antonio Reyes areyespgil en gmail.com
Vie Feb 26 13:48:19 CET 2010


hola,
tengo el siguiente problema y espero me puedan orientar para resolverlo.
quiero comparar ngramas cuya longitud sea mayor a una palabra. es decir,  
tengo un documento N con ngramas del tipo:
n n
n v
n v n j

y varios documentos D que los contienen.
mi pregunta es cómo puedo hacer un programa que dada cualquiera de las  
secuencias de N, por ejemplo n v n j,
identifique si la misma secuencia está en D.
con secuencias = 1 no tengo problemas porque lo hago mediante  
diccionarios, la cuestión es cuando las secuencias superan ese valor.
algún consejo?
gracias de antemano,
antonio


-- 
Usando el novísimo cliente de correo de Opera: http://www.opera.com/mail/



Más información sobre la lista de distribución Python-es