[Python-es] extraer secuencias no adyacentes

Antonio Reyes areyespgil en gmail.com
Sab Abr 17 19:56:07 CEST 2010


hola lista,

me interesa hacer lo siguiente. dado un archivo quiero extraer secuencias  
de palabras no adyacentes.
por ejemplo, supongamos que mi archivo tiene la siguiente línea:

	"La cookie caducará automáticamente cuando salga del navegador"

podría obtener secuencias adyacentes como
[la, cookie]
[cookie, caducará]
[caducará, automáticamente]
...

pero mi idea es que estas secuencias no sean adyacentes, de forma que  
pueda obtener secuencias como:
[la, caducará] con un salto en la adyacencia
[la, automáticamente] con dos saltos
[cookie, cuando] con 3 saltos, etc.

alguno de ustedes sabe cómo podría hacerlo?

gracias por cualquier tip.

antonio



-- 
Usando el novísimo cliente de correo de Opera: http://www.opera.com/mail/



Más información sobre la lista de distribución Python-es