<div dir="ltr">Sorry, this last email was meant to be to the list.<br><br><div class="gmail_quote">On Thu, Aug 21, 2008 at 8:41 AM, William Purcell <span dir="ltr"><<a href="mailto:williamhpurcell@gmail.com">williamhpurcell@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div dir="ltr">I have been trying to do the same thing. Here is something I came up with, although it's not completely dependent on Python. It requires pdftotext to be installed. If your on a linux box, I think it comes in xpdf-utils but I'm not comletely sure. Anyway, install pdftotext and then you could use this function:<br>

----------------------------------------------------------------------------<br>import os<br><br>def readpdf(filepath):<br>    cmd = 'pdftotext -layout %s -'%(filepath,)<br>    lines=os.popen(cmd).readlines()<br>
    return lines<br>
----------------------------------------------------------------------------<br>I would like to find something totally Python, but this has worked for me in a pinch.<br>-Bill<br><br><br><div class="gmail_quote"><div><div>
</div><div class="Wj3C7c">On Thu, Aug 21, 2008 at 5:00 AM, AON LAZIO <span dir="ltr"><<a href="mailto:aonlazio@gmail.com" target="_blank">aonlazio@gmail.com</a>></span> wrote:<br>
</div></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div><div></div><div class="Wj3C7c"><div dir="ltr">Hi, Guys.<br>      I am trying to extract the PDF file content(to get the specific information) using python. I already tried pyPdf with no success. <br>

      Anyone has suggestions? <br>      Thanks in advance.<br>
<br>Aonlazio<br></div>
<br></div></div>--<br>
<a href="http://mail.python.org/mailman/listinfo/python-list" target="_blank">http://mail.python.org/mailman/listinfo/python-list</a><br></blockquote></div><br></div>
</blockquote></div><br></div>