<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal">Hi,<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I am a newbie in python, I need to fetch names of side filters and save in csv [PFA screen shot].<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Following is snippet from code:<o:p></o:p></p>
<p class="MsoNormal">  soup = BeautifulStoneSoup(html)<o:p></o:p></p>
<p class="MsoNormal">#                for e in soup.findAll('div'):<o:p></o:p></p>
<p class="MsoNormal">#                     for c in e.findAll('h3'):<o:p></o:p></p>
<p class="MsoNormal">#                        for d in c.findAll('li'):<o:p></o:p></p>
<p class="MsoNormal">#                            print'@@@@@@@', d.extract()<o:p></o:p></p>
<p class="MsoNormal">#                        <o:p></o:p></p>
<p class="MsoNormal">                        <o:p></o:p></p>
<p class="MsoNormal">#                #select_pod=soup.findAll('div', {"class":"win aboutUs"})<o:p></o:p></p>
<p class="MsoNormal">#                #promeg= select_pod[0].findAll("p")[0]<o:p></o:p></p>
<p class="MsoNormal">#                <o:p></o:p></p>
<p class="MsoNormal">#                <o:p></o:p></p>
<p class="MsoNormal">                <o:p></o:p></p>
<p class="MsoNormal">                <o:p></o:p></p>
<p class="MsoNormal">                <o:p></o:p></p>
<p class="MsoNormal">#                for dv in soup.findAll('div', {"class":"attribution"}):<o:p></o:p></p>
<p class="MsoNormal">#                            ds = dv.findAll("<h3>")<o:p></o:p></p>
<p class="MsoNormal">#                            print ds<o:p></o:p></p>
<p class="MsoNormal">                             <o:p></o:p></p>
<p class="MsoNormal">                <o:p></o:p></p>
<p class="MsoNormal">                <o:p></o:p></p>
<p class="MsoNormal">                select_pod = soup.findAll('div')<o:p></o:p></p>
<p class="MsoNormal">                print select_pod<o:p></o:p></p>
<p class="MsoNormal">                for j in select_pod:<o:p></o:p></p>
<p class="MsoNormal">                        if j is not None:<o:p></o:p></p>
<p class="MsoNormal">                            print j.findall('a')<o:p></o:p></p>
<p class="MsoNormal">                promeg = select_pod.findAll("<h3>")<o:p></o:p></p>
<p class="MsoNormal">                #print '--', promeg<o:p></o:p></p>
<p class="MsoNormal">                <o:p></o:p></p>
<p class="MsoNormal">                <o:p></o:p></p>
<p class="MsoNormal"> <o:p></o:p></p>
<p class="MsoNormal"> <o:p></o:p></p>
<p class="MsoNormal">                #hreflist = [ each.get('value') for each in soup.findAll('<h3>') ]<o:p></o:p></p>
<p class="MsoNormal">                <o:p></o:p></p>
<p class="MsoNormal">               <o:p></o:p></p>
<p class="MsoNormal">                for m in promeg :<o:p></o:p></p>
<p class="MsoNormal">                                if m:<o:p></o:p></p>
<p class="MsoNormal">                                        print 'Data values', m<o:p></o:p></p>
<p class="MsoNormal">                                        fd1.writerow([x[2], m, i[0], "Data Found"])<o:p></o:p></p>
<p class="MsoNormal">                               <o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Structure of HTML:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><div class="attribution"><o:p></o:p></p>
<p class="MsoNormal"><div><o:p></o:p></p>
<p class="MsoNormal"><h3><b>By Brand</b></h3><o:p></o:p></p>
<p class="MsoNormal"><ul><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><a href="http://www.xyz.com/cellphones/nokia/nokia/259-33902/buy"><b>Nokia</b></a><o:p></o:p></p>
<p class="MsoNormal"></li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li class="more"><o:p></o:p></p>
<p class="MsoNormal"></ul><o:p></o:p></p>
<p class="MsoNormal"></div><o:p></o:p></p>
<p class="MsoNormal"><div><o:p></o:p></p>
<p class="MsoNormal"><h3><b>By Seller</b></h3><o:p></o:p></p>
<p class="MsoNormal"><ul><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><a id="att_296935_184059" class="attributeUrlReplacementTarget" href="http://www.xyz.com/cellphones/nokia/amazon-marketplace/296935-184059/buy"><b>Amazon Marketplace</b></a><o:p></o:p></p>
<p class="MsoNormal"><input id="att_296935_184059_replacement" type="hidden" value="http://www.xyz.com/cellphones/nokia/amazon-marketplace/296935-184059/buy"><o:p></o:p></p>
<p class="MsoNormal"></li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li><o:p></o:p></p>
<p class="MsoNormal"><li class="more"><o:p></o:p></p>
<p class="MsoNormal"></ul><o:p></o:p></p>
<p class="MsoNormal"></div><o:p></o:p></p>
<p class="MsoNormal"><div><o:p></o:p></p>
<p class="MsoNormal"><div><o:p></o:p></p>
<p class="MsoNormal"></div><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Output required in csv:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">By Brands<o:p></o:p></p>
<p class="MsoNormal">Nokia<o:p></o:p></p>
<p class="MsoNormal">Samsung<o:p></o:p></p>
<p class="MsoNormal">.<o:p></o:p></p>
<p class="MsoNormal">.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">By Seller<o:p></o:p></p>
<p class="MsoNormal">Amazon<o:p></o:p></p>
<p class="MsoNormal">Buy.com<o:p></o:p></p>
<p class="MsoNormal">.<o:p></o:p></p>
<p class="MsoNormal">.<o:p></o:p></p>
<p class="MsoNormal">.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Please suggest how to fetch details.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Sheetal Singh                     <o:p></o:p></p>
</div>
</body>
</html>