<html><head><meta http-equiv="content-type" content="text/html; charset=GB2312"><style>body { line-height: 1.5; }body { font-size: 14pt; font-family: 'Microsoft YaHei UI'; color: rgb(0, 0, 0); line-height: 1.5; }</style></head><body>
<div><span></span>Hi£º</div><div><br></div><div>    sorry for my poor English first,I am a Chinese<img src="cid:_Foxmail.1@75040e7d-f96a-95d7-8089-91a43d0f04a8" border="0" style="font-size: 14pt; line-height: 1.5; background-color: window;">.</div><div><br></div><div>    when access <span style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"></span><a href="http://hd.chinatax.gov.cn/guoshui/main.jsp,the" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" font-weight:="" normal;="" font-style:="" normal;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">http://hd.chinatax.gov.cn/guoshui/main.jsp</a>  the <span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"> firefox can get cookie and you can find it by devtools,but cookiejar can't.</span></div><div><span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"><br></span></div><div><span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">    the full description is posted :</span><span style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"></span><a href="https://www.reddit.com/r/learnpython/comments/5o9olm/about_cookiesheaderssomething_already_drive_me_mad/?st=iy16b0iq&sh=a5a7e960,A" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" font-weight:="" normal;="" font-style:="" normal;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">https://www.reddit.com/r/learnpython/comments/5o9olm/about_cookiesheaderssomething_already_drive_me_mad/?st=iy16b0iq&sh=a5a7e960,A</a><span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"> </span></div><div><span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"><br></span></div><div><span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">   and after I debug into the code,I find the problem :</span></div><div><span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">   </span><span style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"></span><a href="https://www.reddit.com/r/learnpython/comments/5ogqfi/a_bug_of_anaconda34or_may_be_a_bug_of_python34/" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" font-weight:="" normal;="" font-style:="" normal;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">https://www.reddit.com/r/learnpython/comments/5ogqfi/a_bug_of_anaconda34or_may_be_a_bug_of_python34/</a><span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"> </span></div><div><span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"><br></span></div><div><span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">   python read headers from web server successfully.but when to parse it to </span><span style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">class email.message.Message(policy=compat32),a problem happens.</span></div><div><span style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"><br></span></div><div><span style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">   if the headers contains something like: </span><span style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">Cache-Control : No-cache, I mean there is blank(one or more) beside the ':',the feedparser.py lines:227 will go wrong.</span></div><div><span style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"><br></span></div><div><span style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;">because lines:35_37:</span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""># RFC 2822 $3.6.8 Optional fields.  ftext is %d33-57 / %d59-126, Any character<br># except controls, SP, and ":".<br>headerRE = re.compile(r'^(From |[\041-\071\073-\176]*:|[\t ])')</span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><br></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="">I read RFC 2822 $3.6.8,and yes,the headerRE has no mistake,but as you can see,the headers can be created by programmer,and blank beside ':' do happen,so my suggestion is :</span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="">headerRE = re.compile(r'^(From |[\041-\071\073-\176]*\s*:\s*|[\t ])')<br></span></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><br></span></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="">this may not strict fulfile the RFC,but it acts exactly like other web browser,such firefox,etc.</span></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><br></span></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="">if meet some web site that not strict fulfile the RFC,no matter cookiejar or requests will not get the cookie right.but that not make sense,because web browser can.</span></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><br></span></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="">btw:I changed my feedparser.py,because I need scraw web site in my work.</span></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><br></span></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="">there are also another way to solve the problem,but I think that is really not pythonic.</span></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><br></span></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="">import http.cookiejar, urllib.request<br><br>cj = http.cookiejar.CookieJar()<br>opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))<br><br>r = opener.open("http://hd.chinatax.gov.cn/guoshui/main.jsp")<br><br>pls=r.info().get_payload().split('\r\n')<br>cookiels=[]<br>for x in pls:<br>    if x.strip():<br>        tmp=x.split(':')<br>        if tmp[0]=='Set-Cookie':<br>            cookiels.append(tmp[1])<br>            print(tmp)<br>cookie='.'.join(cookiels)<br>print(cookie)</span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><br></span></div><div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgba(0,="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""><br></span></div><div>Thanks.</div><div><br></div><div>yours . Mengwei lee</div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""></span><div><span microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'="" style="font-family: ''; font-size: 14pt; line-height: 1.5; background-color: window;"><br></span></div><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""></span><span style="font-family: "" microsoft="" yahei="" ui'";="" font-size:="" 19px;="" color:="" rgb(0,="" 0,="" 0);="" background-color:="" rgb(255,="" 255,="" 255);="" font-weight:="" normal;="" font-style:="" normal;text-decoration:="" none;'=""></span>
<div><br></div><hr style="width: 210px; height: 1px;" color="#b5c4df" size="1" align="left">
<div><span><div style="MARGIN: 10px; FONT-FAMILY: verdana; FONT-SIZE: 10pt"><div>1067511899@qq.com</div></div></span></div>
</body></html>