<div class="gmail_quote"><div><div></div><div class="h5"><div class="gmail_quote">On Fri, Sep 16, 2011 at 7:25 AM, Steven D'Aprano <span dir="ltr"><<a href="mailto:steve%2Bcomp.lang.python@pearwood.info" target="_blank">steve+comp.lang.python@pearwood.info</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div>Thomas Rachel wrote:<br>
<br>
> Am 15.09.2011 15:16 schrieb Alan Plum:<br>
><br>
>> The Turkish 'I' is a peculiarity that will probably haunt us programmers<br>
>> until hell freezes over.<br>
<br>
<br>
</div>Meh, I don't think it's much more peculiar that any other diacritic issue.<br>
If I'm German or English, I probably want ö and O to match during<br>
case-insensitive comparisons, so that Zöe and ZOE match. If I'm Icelandic,<br>
I don't. I don't really see why Turkic gets singled out.<br>
<div><br>
<br>
> That's why it would have been nice if the Unicode guys had defined "both<br>
> Turkish i-s" at separate codepoints.<br>
><br>
> Then one could have the three pairs<br>
> I, i ("normal")<br>
> I (other one), ı<br>
><br>
> and<br>
><br>
> İ, i (the other one).<br>
<br>
</div>And then people will say, "How can I match both sorts of dotless uppercase I<br>
but not dotted I when I'm doing comparisons?"<br>
<font color="#888888"><br>
<br>
<br>
--<br>
Steven<br>
</font><div><div></div><div><br>
--<br>
<a href="http://mail.python.org/mailman/listinfo/python-list" target="_blank">http://mail.python.org/mailman/listinfo/python-list</a><br>
</div></div></blockquote></div><br></div></div>Yeah, it's more probable that language conventions and functions grow around characters that look right.<br><br>No one except developers care what specific codepoint they have, so soon you would have a mish-mash of special rules converting between each special case.<br>
<font color="#888888">
<br>P.S. Sorry Steven, i missed clicking "reply to all".<br><br>-- John-John Tedro<br>
</font></div><br>