Thanks all for the suggestions. I think I will start with BeautifulSoup (3.0.7a) and will experiment with other suggested libs if it does not fit into my requirement or if I face issues with this. <br><br><div class="gmail_quote">
On Thu, Sep 10, 2009 at 7:07 PM, Baishampayan Ghose <span dir="ltr">&lt;<a href="mailto:b.ghose@gmail.com">b.ghose@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="im">&gt; Can anyone suggest me a good library for html parsing in python ?<br>
&gt; I googled a found few libararies BeautifulSoup, HTMLParser, SGMLParser etc.<br>
&gt;<br>
&gt; Can anyone suggest me which should I go for from your experience.<br>
<br>
</div>BeautifulSoup was OK, but now it&#39;s broken. Use lxml, it&#39;s very good.<br>
<br>
<a href="http://codespeak.net/lxml/" target="_blank">http://codespeak.net/lxml/</a><br>
<br>
Regards,<br>
BG<br>
<font color="#888888"><br>
<br>
--<br>
Baishampayan Ghose<br>
b.ghose at <a href="http://gmail.com" target="_blank">gmail.com</a><br>
</font><div><div></div><div class="h5">_______________________________________________<br>
BangPypers mailing list<br>
<a href="mailto:BangPypers@python.org">BangPypers@python.org</a><br>
<a href="http://mail.python.org/mailman/listinfo/bangpypers" target="_blank">http://mail.python.org/mailman/listinfo/bangpypers</a><br>
</div></div></blockquote></div><br>