<font color='black' size='2' face='arial'>
<div><FONT face="Arial, Helvetica, sans-serif"></FONT>Hi,</div>


<div>&nbsp;</div>


<div>I'm parsing IMDB movie reviews (each movie is in its own text file). In my script, I'm trying to extract genre information. Movies have up to three categories of genres--but not all have a "genre" tag and that fact is making my script abort whenever it encounters a movie text file that doesn't have a "genre" tag. </div>


<div>&nbsp;</div>


<div>I thought the following should solve it, but it doesn't. The basic question is how I say "if genre information doesn't at all, just make rg1=rg2=rg3="NA"?</div>


<div>&nbsp;</div>


<div>rgenre = re.split(r';', rf.info["genre"]) # When movies have genre information they store it as &lt;genre&gt;Drama;Western;Thriller&lt;/genre&gt;</div>


<div>&nbsp;</div>


<div>if len(rgenre)&gt;0:<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if len(rgenre)&gt;2:<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rg1=rgenre[0]<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rg2=rgenre[1]<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rg3=rgenre[2]<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; elif len(rgenre)==2:<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rg1=rgenre[0]<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rg2=rgenre[1]<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rg3="NA"<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; elif len(rgenre)==1:<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rg1=rgenre[0]<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rg2="NA"<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rg3="NA"<br>
&nbsp;&nbsp;&nbsp;else len(rgenre)&lt;1: # I was hoping this would take care of the "there is no genre information" scenario but it doesn't<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rg1=rg2=rg3="NA"</div>


<div>&nbsp;</div>


<div>This probably does a weird nesting thing, but even simpler&nbsp;version I have tried don't work. </div>


<div>&nbsp;</div>


<div>Thanks very much for any help!</div>


<div>&nbsp;</div>


<div>Tyler<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>
<br>
</div>


<div style="CLEAR: both"></div>
</font>