<div class="gmail_quote">On Fri, Jan 13, 2012 at 9:08 AM, Mark Dickinson <span dir="ltr">&lt;<a href="mailto:dickinsm@gmail.com">dickinsm@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div class="im">On Fri, Jan 13, 2012 at 2:57 AM, Guido van Rossum &lt;<a href="mailto:guido@python.org">guido@python.org</a>&gt; wrote:<br>
&gt; How<br>
&gt; pathological the data needs to be before the collision counter triggers? I&#39;d<br>
&gt; expect *very* pathological.<br>
<br>
</div>How pathological do you consider the set<br>
<br>
   {1 &lt;&lt; n for n in range(2000)}<br>
<br>
to be?  What about the set:<br>
<br>
   ieee754_powers_of_two = {2.0**n for n in range(-1074, 1024)}<br>
<br>
?  The &gt; 2000 elements of the latter set have only 61 distinct hash<br>
values on 64-bit machine, so there will be over 2000 total collisions<br>
involved in creating this set (though admittedly only around 30<br>
collisions per hash value).<span class="HOEnZb"></span><br></blockquote></div><br>Hm... So how does the collision counting work for this case?<br clear="all"><br>-- <br>--Guido van Rossum (<a href="http://python.org/~guido">python.org/~guido</a>)<br>