<div style="line-height:1.7;color:#000000;font-size:14px;font-family:Arial"><div>Hi, I`m a graduate student utilizing sklean for some data work. </div><div>And when I`m handling the data using the Decision Trees library, I found there are some inconvenience:</div><div>Neither the classificationTree nor the regressionTree supports categorical feature. That means the Decision trees model can only accept continuous feature. </div><div>For example, the categorical feature like app name such as google, facebook can`t be input into the model, because they can`t be transformed to continuous value properly. And there don`t exist a corresponding algorithm to divide discrete feature in the Decision Trees library.</div><div>However, the CART algorithm itself has considered the use of categorical feature. So I have made some modification of Decision Trees library based on CART and apply the new model on my own work.  And it proves that the support for categorical feature indeed improves the performance, which is very necessary for decision tree, I think.</div><div>I`m very willing to contribute this to sklearn community, but I`m new to this community, not so familiar about the procedure.</div><div>Could u give some suggestions or comments on this new feature? Or has anyone already processed on this feature? Thank you so much.</div><div><br></div><div>Best wishes!</div><div><br></div><br><br><br><br><div style="position:relative;zoom:1">--<br><div><div style="line-height: 23.7999992370605px;"><span style="line-height: 23.8px;">顺颂时祺!</span></div><div style="line-height: 23.7999992370605px;"><span style="line-height: 23.8px;"><br></span></div><div style="line-height: 23.7999992370605px;"><span style="font-size: 18px;"><b><br></b></span></div><div style="line-height: 23.7999992370605px;"><span style="font-size: 18px; font-family: 'Microsoft Yahei';">李扬 <i></i></span></div><div style="line-height: 23.7999992370605px;"><span style="font-family: 'Microsoft Yahei';">上海交通大学  <span style="font-family: 'Microsoft Yahei'; line-height: 23.7999992370605px;">电子信息 与 电气工程 学院  </span></span></div><div style="line-height: 23.7999992370605px;"><span style="font-family: 'Microsoft Yahei';">电话:18818212371</span></div><div style="line-height: 23.7999992370605px;"><span style="font-family: 'Microsoft Yahei';">地址:上海市闵行区东川路800号</span></div><div style="line-height: 23.7999992370605px;"><span style="font-family: 'Microsoft Yahei';">邮编:200240</span></div></div><div><br></div><div>Yang Li  +86 188 1821 2371</div><div><span style="line-height: 23.7999992370605px;">Shanghai Jiao Tong University</span></div><div>School of Electronic,Information and Electrical Engineering F1203026</div><div>800 Dongchuan Road, Minhang District, Shanghai 200240</div><div><br></div><div><br></div><div> </div><div style="clear:both"></div></div></div><br><br><span title="neteasefooter"><p> </p></span>