<div>Can you write a solid web crawler in under an hour? If so Weotta has quite the challenge for you.</div><div><br></div><div>Weotta, the local discovery company, is based in the Bay Area. We are working on next generation collaborative local search technology, currently in private beta, planning to launch this fall. You can find out a little more about us at <a href="http://blog.weotta.com/">http://blog.weotta.com/</a> and the technology behind Weotta at <a href="http://streamhacker.wordpress.com/">http://streamhacker.wordpress.com/</a></div>
<div><br></div><div>We&#39;re looking for a part-time developer (can transition to full-time) that can pump out web crawlers while creating a framework for to make developing new crawlers easier. We do deep crawling with BeautifulSoup &amp; mechanize, but are very interested in transitioning to use <a href="http://www.80legs.com/">http://www.80legs.com/</a>. In fact, the first challenge you&#39;d be tasked with is trying to write a Jython crawler for 80legs (with BeautifulSoup or lxml). Otherwise we might have to use java :(</div>
<div><br></div><div>Other desired skills include:</div><div>* Good communication</div><div>* Excels working with a small team (5 people distributed around the Bay Area)</div><div>* Cool with agile development</div><div>* Pragmatic about testing and refactoring</div>
<div>* Huge bonus points for experience dealing with large amounts of data</div><div><br></div><div>If you can work full-time and like learning new technology, we&#39;re also using NLTK for NLP and Erlang for search &amp; indexing.</div>
<div><br></div><div>We&#39;re quite the boostrapped company, which means we can pay some $$ and do stock options. If you are interested please send an email with CV/resume, code samples, links to OSS projects, etc to <a href="mailto:jobs@weotta.com">jobs@weotta.com</a>.</div>