<html><head><meta http-equiv="content-type" content="text/html; charset=utf-8"></head><body dir="auto"><div dir="ltr">Currently, it is not implemented. Feel free to open an issue regarding sparse support for HistGradientBoosting.</div><div dir="ltr"><br></div><div dir="ltr">Thomas</div><div dir="ltr"><br><blockquote type="cite">On Oct 21, 2019, at 9:00 PM, Jason Wolosonovich <jason@refinerynet.com> wrote:<br><br></blockquote></div><blockquote type="cite"><div dir="ltr"><div dir="ltr">Hi!<div><br></div><div>I'm getting an error when trying to use the HistGradientBoostingClassifier by feeding it the output from CountVectorizer and then TfidfTransformer. The error is:</div><div><br></div><div><span style="color:rgb(85,85,85);font-family:"Source Code Pro",Menlo,monospace;font-size:13px;white-space:pre-wrap">TypeError</span><span style="color:rgb(85,85,85);font-family:"Source Code Pro",Menlo,monospace;font-size:13px;white-space:pre-wrap">: A sparse matrix was passed, but dense data is required. Use X.toarray() to convert to a dense numpy array.</span><br></div><div><br></div><div>I haven't opened an issue yet because I wanted to get more clarification on whether this just isn't implemented yet or if there is some reason inherent to histogram based boosting that prevents sparse inputs from being used.</div><div><br></div><div>Making the array dense in my case causes me to run out of memory. Thanks in advance!</div><div><br></div><div>-Jason</div><div><br></div></div>
<span>_______________________________________________</span><br><span>scikit-learn mailing list</span><br><span>scikit-learn@python.org</span><br><span>https://mail.python.org/mailman/listinfo/scikit-learn</span><br></div></blockquote></body></html>