<div dir="ltr">My question is more along the lines of will the DT classifier falsely infer an ordering?</div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><~~~~~~~~~~~~~~~~~~~~~~~~~~~><br>J. Andrew Howe, PhD<div><a href="http://www.andrewhowe.com" target="_blank">www.andrewhowe.com</a></div><div><a href="http://www.linkedin.com/in/ahowe42" style="color:rgb(17,85,204)" target="_blank">http://www.linkedin.com/in/ahowe42</a></div><div><a href="https://www.researchgate.net/profile/John_Howe12/" target="_blank">https://www.researchgate.net/profile/John_Howe12/</a><br>I live to learn, so I can learn to live. - me<br><~~~~~~~~~~~~~~~~~~~~~~~~~~~></div></div></div></div></div></div>
<br><div class="gmail_quote">On Wed, Mar 29, 2017 at 10:32 AM, Olivier Grisel <span dir="ltr"><<a href="mailto:olivier.grisel@ensta.org" target="_blank">olivier.grisel@ensta.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">For large enough models (e.g. random forests or gradient boosted trees<br>
ensembles) I would definitely recommend arbitrary integer coding for<br>
the categorical variables.<br>
<br>
Try both, use cross-validation and see for yourself.<br>
<span class="HOEnZb"><font color="#888888"><br>
--<br>
Olivier<br>
______________________________<wbr>_________________<br>
scikit-learn mailing list<br>
<a href="mailto:scikit-learn@python.org">scikit-learn@python.org</a><br>
<a href="https://mail.python.org/mailman/listinfo/scikit-learn" rel="noreferrer" target="_blank">https://mail.python.org/<wbr>mailman/listinfo/scikit-learn</a><br>
</font></span></blockquote></div><br></div>