[Python-es] extraer secuencias no adyacentes

Jose Caballero jcaballero.hep en gmail.com
Sab Abr 17 20:06:42 CEST 2010



On Apr 17, 2010, at 13:56, "Antonio Reyes" <areyespgil en gmail.com> wrote:

> hola lista,
>
> me interesa hacer lo siguiente. dado un archivo quiero extraer  
> secuencias de palabras no adyacentes.
> por ejemplo, supongamos que mi archivo tiene la siguiente línea:
>
>    "La cookie caducará automáticamente cuando salga del navegador"
>
> podría obtener secuencias adyacentes como
> [la, cookie]
> [cookie, caducará]
> [caducará, automáticamente]
> ...
>
> pero mi idea es que estas secuencias no sean adyacentes, de forma  
> que pueda obtener secuencias como:
> [la, caducará] con un salto en la adyacencia
> [la, automáticamente] con dos saltos
> [cookie, cuando] con 3 saltos, etc.
>
> alguno de ustedes sabe cómo podría hacerlo?
>
> gracias por cualquier tip.
>
> antonio

¿siempre dos palabras?
¿han de estar en el mismo orden que en el texto original?

¿cómo lo estás intentando?


Más información sobre la lista de distribución Python-es