Awesome. Great going.<br><br>I also read the interview on Spike Developer Zone. <br><br>Dorai<br><br><div class="gmail_quote">On Fri, Mar 7, 2008 at 9:58 PM, Anand Balachandran Pillai &lt;<a href="mailto:abpillai@gmail.com">abpillai@gmail.com</a>&gt; wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">I actually went ahead and did this today. I registered a new blog<br>
at <a href="http://pythonjobs.blogspot.com" target="_blank">http://pythonjobs.blogspot.com</a> . It took me roughly 3 hours to<br>
write a custom crawler using HarvestMan to crawl monthly archives<br>
of bangpypers and post Jobs automatically to blogger. It uses<br>
the Google blogger API in gdata-python-client library.<br>
<br>
<a href="http://code.google.com/p/gdata-python-client/" target="_blank">http://code.google.com/p/gdata-python-client/</a><br>
<br>
If someone wants to see the code of the custom crawler<br>
it is available in the HarvestMan-2.0 trunk.<br>
<br>
<a href="http://svn.eiao.net/robacc/experimental/HarvestMan-2.0/harvestman/apps/postingcrawler.py" target="_blank">http://svn.eiao.net/robacc/experimental/HarvestMan-2.0/harvestman/apps/postingcrawler.py</a><br>
<br>
I wrote a custom blogger module by using sample code from the google blogger<br>
API. Since it contains google&#39;s code, I have not checked it into the<br>
subversion trunk.<br>
If someone wants the code, let me know.<br>
<br>
To make sure your jobs are in the Blog, just ensure that you make your<br>
job posts with [JOB] in the title. That is all the crawler looks for.<br>
<br>
Regards,<br>
--Anand<br>
<br>
<br>
On Fri, Mar 7, 2008 at 6:32 PM, Anand Balachandran Pillai<br>
<div><div></div><div class="Wj3C7c">&lt;<a href="mailto:abpillai@gmail.com">abpillai@gmail.com</a>&gt; wrote:<br>
&gt; On Fri, Mar 7, 2008 at 6:30 PM, Anand Balachandran Pillai<br>
&gt; &nbsp;&lt;<a href="mailto:abpillai@gmail.com">abpillai@gmail.com</a>&gt; wrote:<br>
&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; On Fri, Mar 7, 2008 at 6:05 PM, Harish Krishnan &lt;<a href="mailto:bugsy.seigel@gmail.com">bugsy.seigel@gmail.com</a>&gt; wrote:<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt; On 07-Mar-08, at 4:57 PM, Anand Balachandran Pillai wrote:<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt; &nbsp;1. Automate blog posting backend when a mail which seems to mention a new<br>
&gt; &nbsp;&gt; &nbsp;&gt; &nbsp;job posting is posted. This can be done bye requiring specific keyword(s)<br>
&gt; &nbsp;&gt; &nbsp;&gt; in<br>
&gt; &nbsp;&gt; &nbsp;&gt; &nbsp;the subject for job postings such as [JOB]. I am not sure, but mailman<br>
&gt; &nbsp;&gt; &nbsp;&gt; might<br>
&gt; &nbsp;&gt; &nbsp;&gt; &nbsp;allow such customizations in the backend.<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt; Sounds like a nice idea. It would also be good if we have a policy for not<br>
&gt; &nbsp;&gt; &nbsp;&gt; posting jobs directly on the mailing list else it will lead to duplication.<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt; &nbsp;2. An incremental crawler (always!) which monitors the group for postings<br>
&gt; &nbsp;&gt; &nbsp;&gt; and<br>
&gt; &nbsp;&gt; &nbsp;&gt; &nbsp;automatically fetches JOB posting posts (similar approach, use keywords or<br>
&gt; &nbsp;&gt; &nbsp;&gt; &nbsp;naive bayesian classification!) and post it to a specific blog.<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt; This is even better. what does it take for this to work?<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;Nothing much. Just give me half a day to create a custom crawler for this<br>
&gt; &nbsp;&gt; &nbsp;on top of HarvestMan :)<br>
&gt; &nbsp;Ok, this is not posturing :) If someone can register an appropriate blog and<br>
&gt; &nbsp;send me the URL and the auth credentials I will create the &quot;job<br>
&gt; &nbsp;posting crawler&quot;.<br>
&gt; &nbsp;Only that someone has to bear the responsibility of running it on<br>
&gt; &nbsp;a frequent basis.<br>
&gt;<br>
&gt; &nbsp;gnuyoga, can you do this ? It would be a nice exercise to write a custom<br>
&gt; &nbsp;crawler for this...<br>
&gt;<br>
&gt; &gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt; Harish<br>
&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt; _______________________________________________<br>
&gt; &nbsp;&gt; &nbsp;&gt; &nbsp;BangPypers mailing list<br>
&gt; &nbsp;&gt; &nbsp;&gt; &nbsp;<a href="mailto:BangPypers@python.org">BangPypers@python.org</a><br>
&gt; &nbsp;&gt; &nbsp;&gt; &nbsp;<a href="http://mail.python.org/mailman/listinfo/bangpypers" target="_blank">http://mail.python.org/mailman/listinfo/bangpypers</a><br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt;<br>
&gt; &nbsp;&gt; &nbsp;--<br>
&gt; &nbsp;&gt; &nbsp;-Anand<br>
&gt; &nbsp;&gt;<br>
&gt;<br>
&gt; &nbsp;Thanks<br>
&gt;<br>
&gt; &nbsp;--<br>
&gt; &nbsp;-Anand<br>
&gt;<br>
<br>
<br>
<br>
--<br>
-Anand<br>
_______________________________________________<br>
BangPypers mailing list<br>
<a href="mailto:BangPypers@python.org">BangPypers@python.org</a><br>
<a href="http://mail.python.org/mailman/listinfo/bangpypers" target="_blank">http://mail.python.org/mailman/listinfo/bangpypers</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Dorai Thodla (<a href="http://www.thodla.com">http://www.thodla.com</a>)<br>US: 650-206-2688<br>India: 98408 89258