<div dir="ltr"><div class="gmail_default" style="font-size:small">Hello -</div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">I was just wondering if there was a way to improve performance on the one-hot encoder.  Or, is there any plans to do so in the future?  I am working with a matrix that will ultimately have 20 million categorical variables, and my bottleneck is the one-hot encoder.  </div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">Let me know if this isn't the place to inquire.  My code is very simple when using the encoder, but I cut and pasted it here for completeness.</div><div class="gmail_default" style="font-size:small"><div class="gmail_default">   </div><div class="gmail_default">    enc = OneHotEncoder(sparse=True)</div><div class="gmail_default">    Xtrain = enc.fit_transform(tiledata)</div><div><br></div></div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">Thanks,<br>Sarah</div><div class="gmail_default" style="font-size:small"> </div></div>