[Python-es] extraer secuencias no adyacentes
Jose Caballero
jcaballero.hep en gmail.com
Sab Abr 17 20:06:42 CEST 2010
On Apr 17, 2010, at 13:56, "Antonio Reyes" <areyespgil en gmail.com> wrote:
> hola lista,
>
> me interesa hacer lo siguiente. dado un archivo quiero extraer
> secuencias de palabras no adyacentes.
> por ejemplo, supongamos que mi archivo tiene la siguiente línea:
>
> "La cookie caducará automáticamente cuando salga del navegador"
>
> podría obtener secuencias adyacentes como
> [la, cookie]
> [cookie, caducará]
> [caducará, automáticamente]
> ...
>
> pero mi idea es que estas secuencias no sean adyacentes, de forma
> que pueda obtener secuencias como:
> [la, caducará] con un salto en la adyacencia
> [la, automáticamente] con dos saltos
> [cookie, cuando] con 3 saltos, etc.
>
> alguno de ustedes sabe cómo podría hacerlo?
>
> gracias por cualquier tip.
>
> antonio
¿siempre dos palabras?
¿han de estar en el mismo orden que en el texto original?
¿cómo lo estás intentando?
Más información sobre la lista de distribución Python-es