Hey guys,<div><br></div><div>I want to write a short script that takes from an input excel file w/ a bunch of rows and columns.  The two columns I&#39;m interested in are &quot;high gains&quot; and &quot;genes.&quot;  I want the user to write:</div>
<div><br></div><div>&gt;&gt;&gt;Which genes are associated with gains over 20%?</div><div><br></div><div>and then I want the script to search through the excel file, find in the &quot;high gains&quot; column when the number is greater than 20%, and then store the corresponding genes in that row (but in the &quot;genes&quot; column).  I know this should be super simple, but I&#39;m having trouble breaking the problem into smaller, manageable pieces.  For instance, the &quot;high gains&quot; column does not have just integers, it is in the format YYYY%.  Also, I&#39;d like for the final script to be usable in R if possible, too.</div>
<div><br></div><div>pseudocode is something like this:</div><div><br></div><div>for line in lines:</div><div>  if item in &quot;high gains&quot; &gt; 20  </div><div>     create new dictionary</div><div>       store genes from &quot;genes&quot; into new dictionary</div>
<div><br></div><div>Much thanks in advance!</div>