<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.5.7233.28">
<TITLE>RE: [Web-SIG] Encoding</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/plain format -->

<P><FONT SIZE=2>Mohamad Babaei wrote:<BR>
&gt; I'm working on a program that fetches some translated<BR>
&gt; texts from *Altavista online translator , *it works<BR>
&gt; fine with languages like German, french &amp; .. but it<BR>
&gt; can not get translated text in Japanese or Russian<BR>
&gt; or chinese. my code is something like this:<BR>
&gt;<BR>
&gt; data1 = urllib.urlopen('<A HREF="http://www.babelfish">http://www.babelfish</A>.<BR>
&gt;&nbsp;&nbsp; altavista.com/babelfish/trurl_pagecontent?<BR>
&gt;&nbsp;&nbsp; lp=en_ru&amp;url=<A HREF="http://www.google.com').read(">http://www.google.com').read(</A>)<BR>
&gt; data1=data1.decode('utf-8')<BR>
&gt; f=open('/usr/local/new/tt.html','w')<BR>
&gt; f.write(data1.encode('utf-8'))<BR>
&gt; f.close()<BR>
<BR>
1. Have you examined the response headers on a request for Japanese content and verified that the response is encoded in UTF-8?<BR>
2. Why decode it just to turn around and encode it again with the same encoding?<BR>
<BR>
<BR>
Robert Brewer<BR>
System Architect<BR>
Amor Ministries<BR>
fumanchu@amor.org</FONT>
</P>

</BODY>
</HTML>