Comparar y extraer

Chema Cortes pych3m4 en gmail.com
Lun Jun 23 00:34:49 CEST 2008


El 2008/6/22  <areyes en dsic.upv.es> escribió:
> Hola,
> estoy iniciando en cuestiones de programación y de tratamiento de lenguaje
> natural.
> Mi pregunta es la siguiente, tengo 2 archivos, el primero tiene el formato:
>     abuse
>     abatament
>     comunication
>     dye
>     Wn
> El segundo tiene el siguiente:
>     abatement       2       3       @       ~
>     acute_leukemia  1       2       @       ~
>     acute_lymphoblastic_leukemia    1       1       @       1
>     acute_lymphocytic_leukemia      1       1       @       1
>     acute_myelocytic_leukemia       1       1       @       1
>     acute_myeloid_leukemia  1       1       @       1
>     acute_organic_brain_syndrome    1       1       @       1
>     acute_pyelonephritis    1       1       @       1
> Quiero saber cómo puedo comparar el archivo 1 con el 2 y si en el archivo 2
> aparece una palabra del 1, copiar toda la línea en un archivo nuevo, de la
> fomra siguiente:
>
> si abatament en 2:
> entonces ['abatement       2       3       @       ~'] se copie a archivo
> nuevo

Lo primero sería crear una lista de palabras con el fichero 1. Con
esta lista, se iría chequeando línea por línea del fichero 2 e ir
escribiendo la líneas en el fichero final.

Te pongo una versión rápida de todo lo dicho:

palabras=(w for w in file("fichero_1.txt"))
file("fichero_final","w").writelines( linea for linea in
file("fichero_2.txt") if any(w for w in palabras if w in linea))
_______________________________________________
Lista de correo Python-es 
http://listas.aditel.org/listinfo/python-es
FAQ: http://listas.aditel.org/faqpyes





Más información sobre la lista de distribución Python-es