<br>I think I have a solution.<br><br><span style="font-weight: bold;">File</span><br>############################<br>(0012,0042) Clinical Trial Subject Reading ID LO 1<br>(0012,0050) Clinical Trial Time Point ID LO 1<br>(0012,0051) Clinical Trial Time Point Description ST 1
<br>(0012,0060) Clinical Trial Coordinating Center Name LO 1<br>(0018,0010) Contrast/Bolus Agent LO 1<br>(0018,0012) Contrast/Bolus Agent Sequence SQ 1<br>(0018,0014) Contrast/Bolus Administration Route Sequence SQ 1<br>(0018,0015) Body Part Examined CS 1
<br><br><br><span style="font-weight: bold;">Script</span><br>#############################<br>#!/usr/bin/python<br><br>import re<br><br>#matchstr regex flow<br># (\(\d+,\d+\))&nbsp;&nbsp;&nbsp;&nbsp; # (0018,0014)<br># \s&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; # [space]
<br># (..*)&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; # Contrast/Bolus Administration Route Sequence<br># \s&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; # space<br># ([a-z]{2})&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; # SQ - two letters and no more<br># \s&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; # [space]<br># (\d)&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; # 1 - single digit
<br># re.I)&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; # case insensitive<br><br>matchstr = re.compile(r&quot;(\(\d+,\d+\))\s(..*)\s([a-z]{2})\s(\d)&quot;,re.I)<br>myfile = open(&#39;/tmp/file&#39;,&#39;r&#39;)<br><br>for line in myfile.readlines():<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; regex_match = matchstr.match(line)<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if regex_match:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; print regex_match.group(1) + &quot;;&quot; + regex_match.group(2) + &quot;;&quot; + regex_match.group(3) + &quot;;&quot; + regex_match.group(4)
<br><br><br><span style="font-weight: bold;">Output</span><br>#####################<br>(0012,0042);Clinical Trial Subject Reading ID;LO;1<br>(0012,0050);Clinical Trial Time Point ID;LO;1<br>(0012,0051);Clinical Trial Time Point Description;ST;1
<br>(0012,0060);Clinical Trial Coordinating Center Name;LO;1<br>(0018,0010);Contrast/Bolus Agent;LO;1<br>(0018,0012);Contrast/Bolus Agent Sequence;SQ;1<br>(0018,0014);Contrast/Bolus Administration Route Sequence;SQ;1<br>(0018,0015);Body Part Examined;CS;1
<br><br><br><div><span class="gmail_quote">On 6/27/07, <b class="gmail_sendername">Gardner, Dean</b> &lt;<a href="mailto:Dean.Gardner@barco.com">Dean.Gardner@barco.com</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">







<div>


<p><span lang="en-gb"><font face="Arial" size="2">Hi </font></span>
</p>

<p><span lang="en-gb"><font face="Arial" size="2">I have a text file that I would like to split up so that I can use it in Excel to filter a certain field. However as it is a flat text file I need to do some processing on it so that Excel can correctly import it.
</font></span></p>

<p><span lang="en-nz"><font face="Arial" size="2">File Example:</font></span>

<br><span lang="en-nz"><font face="Arial" size="2">tag &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; desc&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; VR&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; VM</font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0012,0042) Clinical Trial Subject Reading ID LO 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0012,0050) Clinical Trial Time Point ID LO 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0012,0051) Clinical Trial Time Point Description ST 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0012,0060) Clinical Trial Coordinating Center Name LO 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0018,0010) Contrast/Bolus Agent LO 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0018,0012) Contrast/Bolus Agent Sequence SQ 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0018,0014) Contrast/Bolus Administration Route Sequence SQ 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0018,0015) Body Part Examined CS 1 </font></span>
</p>

<p><span lang="en-nz"><font face="Arial" size="2">What I essentially want is to use python to process this file to give me </font></span>
</p>
<br>

<p><span lang="en-nz"><font face="Arial" size="2">(0012,0042); Clinical Trial Subject Reading ID; LO; 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0012,0050); Clinical Trial Time Point ID; LO; 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0012,0051); Clinical Trial Time Point Description; ST; 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0012,0060); Clinical Trial Coordinating Center Name; LO; 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0018,0010); Contrast/Bolus Agent; LO; 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0018,0012); Contrast/Bolus Agent Sequence; SQ ;1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0018,0014); Contrast/Bolus Administration Route Sequence; SQ; 1 </font></span>

<br><span lang="en-nz"><font face="Arial" size="2">(0018,0015); Body Part Examined; CS; 1 </font></span>
</p>

<p><span lang="en-nz"><font face="Arial" size="2">so that I can import to excel using a delimiter. </font></span>
</p>

<p><span lang="en-nz"><font face="Arial" size="2">This file is extremely long and all I essentially want to do is to break it into it &#39;fields&#39;</font></span>
</p>

<p><span lang="en-nz"><font face="Arial" size="2">Now I suspect that regular expressions are the way to go but I have only basic experience of using these and I have no idea what I should be doing.</font></span></p>

<p><span lang="en-nz"><font face="Arial" size="2">Can anyone help.</font></span>
</p>

<p><span lang="en-nz"><font face="Arial" size="2">Thanks</font></span>
</p>
<br>

<p></p><p>DISCLAIMER:<br>Unless indicated otherwise, the information contained in this message is privileged and confidential, and is intended only for the use of the addressee(s) named above and others who have been specifically authorized to receive it. If you are not the intended recipient, you are hereby notified that any dissemination, distribution or copying of this message and/or attachments is strictly prohibited. The company accepts no liability for any damage caused by any virus transmitted by this email. Furthermore, the company does not warrant a proper and complete transmission of this information, nor does it accept liability for any delays. If you have received this message in error, please contact the sender and delete the message. Thank you.
</p></div>
<br>_______________________________________________<br>Tutor maillist &nbsp;- &nbsp;<a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:Tutor@python.org">Tutor@python.org</a><br><a onclick="return top.js.OpenExtLink(window,event,this)" href="http://mail.python.org/mailman/listinfo/tutor" target="_blank">
http://mail.python.org/mailman/listinfo/tutor</a><br><br></blockquote></div><br>