<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-9" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
Well, I'm a self taught Turkish python coder. I was bitten by this
first in Python 2.3 and asked the group about it then. You can find the
correspondence by googling "<span class="Apple-style-span"
 style="color: rgb(0, 0, 0); font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; background-color: rgb(255, 255, 255); font-size: medium;"><a
 href="http://mail.python.org/pipermail/python-list/2003-April/809637.html">unicode
bug in turkish characters?</a></span>" There are a couple of posts with
that topic line but they don't come out in one thread. So check them
all.<br>
<br>
Anyway, to summarize, Martin v.Löwis answered my question back then and
suggested some locale settings but the problem seems to be with Windows
actually. His method worked on Linux, but not on windows. He said that
Python delegates uppercasing of strings to the operating system on
Windows, and Windows is broken there. What he said was: <br>
<br>
<span class="Apple-style-span"
 style="color: rgb(0, 0, 0); font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; background-color: rgb(255, 255, 255); font-size: medium;">
<pre>"Python delegates the toupper call to the operating system. It does not,
in itself, include a database of lower/upper case conversions for all 
locales.

So there is nothing we can do about that; ask Microsoft."

So I ended up not asking Microsoft of course, but using [iÝ] in re and writing a couple of utility functions upper_tr(), lower_tr() and title_tr() etc to use in my own projects. But of course when foreign language names etc. are mixed in a text it blows but I can't see a way to avoid it when that's the case.

I hope this helps,

</pre>
</span>
<pre class="moz-signature" cols="72">Oktay Safak</pre>
<br>
<br>
Thomas Rachel wrote:
<blockquote cite="mid:j4usl8$jel$1@r03.glglgl.eu" type="cite">Am
15.09.2011 15:16 schrieb Alan Plum: <br>
  <br>
  <blockquote type="cite">The Turkish 'I' is a peculiarity that will
probably haunt us programmers <br>
until hell freezes over. <br>
  </blockquote>
  <br>
That's why it would have been nice if the Unicode guys had defined
"both Turkish i-s" at separate codepoints. <br>
  <br>
Then one could have the three pairs <br>
I, i ("normal") <br>
I (other one), ý <br>
  <br>
and <br>
  <br>
Ý, i (the other one). <br>
  <br>
But alas, they haven't. <br>
  <br>
  <br>
Thomas <br>
</blockquote>
</body>
</html>