On 16 September 2012 08:20, Santosh Kumar <span dir="ltr"><<a href="mailto:sntshkmr60@gmail.com" target="_blank">sntshkmr60@gmail.com</a>></span> wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
I want to extract (no I don't want to download) all links that end in<br>
a certain extension.<br>
<br>
Suppose there is a webpage, and in the head of that webpage there are<br>
4 different CSS files linked to external server. Let the head look<br>
like this:<br>
<br>
    <link rel="stylesheet" type="text/css" href="<a href="http://foo.bar/part1.css" target="_blank">http://foo.bar/part1.css</a>"><br>
    <link rel="stylesheet" type="text/css" href="<a href="http://foo.bar/part2.css" target="_blank">http://foo.bar/part2.css</a>"><br>
    <link rel="stylesheet" type="text/css" href="<a href="http://foo.bar/part3.css" target="_blank">http://foo.bar/part3.css</a>"><br>
    <link rel="stylesheet" type="text/css" href="<a href="http://foo.bar/part4.css" target="_blank">http://foo.bar/part4.css</a>"><br>
<br>
Please note that I don't want to download those CSS, instead I want<br>
something like this (to stdout):<br>
<br>
    <a href="http://foo.bar/part1.css" target="_blank">http://foo.bar/part1.css</a><br>
    <a href="http://foo.bar/part1.css" target="_blank">http://foo.bar/part1.css</a><br>
    <a href="http://foo.bar/part1.css" target="_blank">http://foo.bar/part1.css</a><br>
    <a href="http://foo.bar/part1.css" target="_blank">http://foo.bar/part1.css</a><br>
<br>
Also I don't want to use external libraries. I am asking for: which<br>
libraries and functions should I use?<br>
</blockquote></div><br><div>If you don't want to use any third-party libraries then the standard library has a module urllib2 for downloading a html file and htmlparser for parsing it:</div><div><div><div><a href="http://docs.python.org/library/urllib2.html#examples">http://docs.python.org/library/urllib2.html#examples</a></div>
</div><div><a href="http://docs.python.org/library/htmlparser.html#example-html-parser-application">http://docs.python.org/library/htmlparser.html#example-html-parser-application</a></div></div><div><br></div><div>Oscar</div>
<div><br></div><div><br></div><div><br></div>