Do you require tolerance for non well formed xml / html ? If y, you may consider sgmlop <a href="http://effbot.org/zone/sgmlop-index.htm">http://effbot.org/zone/sgmlop-index.htm</a><br><br><div class="gmail_quote">On Thu, Sep 10, 2009 at 7:07 PM, Baishampayan Ghose <span dir="ltr">&lt;<a href="mailto:b.ghose@gmail.com">b.ghose@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="im">&gt; Can anyone suggest me a good library for html parsing in python ?<br>
&gt; I googled a found few libararies BeautifulSoup, HTMLParser, SGMLParser etc.<br>
&gt;<br>
&gt; Can anyone suggest me which should I go for from your experience.<br>
<br>
</div>BeautifulSoup was OK, but now it&#39;s broken. Use lxml, it&#39;s very good.<br>
<br>
<a href="http://codespeak.net/lxml/" target="_blank">http://codespeak.net/lxml/</a><br>
<br>
Regards,<br>
BG<br>
<font color="#888888"><br>
<br>
--<br>
Baishampayan Ghose<br>
b.ghose at <a href="http://gmail.com" target="_blank">gmail.com</a><br>
</font><div><div></div><div class="h5">_______________________________________________<br>
BangPypers mailing list<br>
<a href="mailto:BangPypers@python.org">BangPypers@python.org</a><br>
<a href="http://mail.python.org/mailman/listinfo/bangpypers" target="_blank">http://mail.python.org/mailman/listinfo/bangpypers</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>--------------------------------------------------------<br>blog: <a href="http://blog.dhananjaynene.com">http://blog.dhananjaynene.com</a> <br>twitter: <a href="http://twitter.com/dnene">http://twitter.com/dnene</a><br>