<div dir="ltr">Hi,<br><div class="gmail_quote"><div dir="ltr"><div><div><div><div><div><div><div><br></div><div>I am currently exploring the problem of speed bump detection using accelerometer time series data.<br></div>I have extracted some features based on mean, std deviation etc  within a time window.<br><br></div>Since the dataset is highly skewed ( I have just 5  positive samples for every > 300 samples)<br></div>I was looking into <br><br>One ClassSVM <br>covariance.EllipticEnvelope<br>sklearn.ensemble.IsolationForest<br><p>but I am not sure how to use them. <br></p><p>What I get from docs<br></p>separate the positive examples and train using only negative examples<br><pre><span class="">clf</span><span class="">.</span><span class="">fit</span><span class="">(</span><span class="">X_train</span><span class="">)</span></pre>and then<br>predict the positive examples using<br>clf.predict(X_test)<br><br></div><br>I am not sure what is then the role of positive examples in my training dataset or how can I use them to improve my classifier so that I can predict better on new samples.<br><br><br></div><div>Can we do something like Cross validation to learn the parameters as in normal binary SVM classification<br></div><br></div>Thanks,?<br></div>Amita<br><div><div><div><br><div><div><div><div><div><div data-smartmail="gmail_signature"><div dir="ltr"><div>Amita Misra<div><div>Graduate Student Researcher</div><div>Natural Language and Dialogue Systems Lab</div><div>Baskin School of Engineering</div><div>University of California Santa Cruz</div></div></div><div><br></div></div></div>
</div></div></div></div></div></div></div></div></div>
<br></div><br><br clear="all"><br>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div>Amita Misra<div><div>Graduate Student Researcher</div><div>Natural Language and Dialogue Systems Lab</div><div>Baskin School of Engineering</div><div>University of California Santa Cruz</div></div></div><div><br></div></div></div>
</div>