[Python-es] sobre pdf

Robert C. Rodriguez aciddized en gmail.com
Lun Mayo 24 17:14:34 CEST 2010


El 24 de mayo de 2010 14:04, Chema Cortes <pych3m4 en gmail.com> escribió:

> El día 24 de mayo de 2010 09:35, matt ledding <matt en fifthbiz.com>
> escribió:
>
> > Probablemente hay mejores soluciones por gente más puesto que yo, pero
> otra
> > manera de extraer el texto de archivos PDF es llamar al comando de Linux
> > "pdftotext" y usar el output.  No muy elegante, pero es un apaño...
>
> Al menos ésa es la solución empleada por plone3 para indexar pdfs, por
> lo que sospecho que no hay mucho más dónde elegir.
>
> La utilidad "pdftotext" se instala junto con poppler-utils
> (preferible) y con xpdf.
> _______________________________________________
> Python-es mailing list
> Python-es en python.org
> http://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>

Hay algo que no entiendo ¿porqué dais por hecho que utiliza Linux? En el
mensaje original no dice nada de nada.


Salut


--
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://mail.python.org/pipermail/python-es/attachments/20100524/3cb36bcb/attachment.html>


Más información sobre la lista de distribución Python-es