<div class="gmail_quote">On Wed, Jan 6, 2010 at 1:27 PM, Tim Chase <span dir="ltr"><<a href="mailto:python.list@tim.thechases.com">python.list@tim.thechases.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
But if you're using it on HTML form text, regexps are usually the wrong tool, and you should be using an HTML parser (such as BeautifulSoup) that knows how to handle odd text and escapings better and more robustly than regexps will.<br>
</blockquote><div><br>
</div></div>I have an automatically generated HTML form from which I need to extract data to the script which this form calls (to which the information is sent). I believe BeautifulSoup is geared to scraping pages that exist permanently on the web. By the time BeautifulSoup was called, this page would be gone. Any other ideas?<br>
TIA<br>beno<br>