Ich habe gerade dieses merkwürdige Verhalten von Python 3.5 festgestellt:
Python 3.5.1+ (default, Mar 30 2016, 22:46:26)
[GCC 5.3.1 20160330] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import re
>>> s = 'One\u2003Two'
>>> re.search('\s+', s)
<_sre.SRE_Match object; span=(3, 4), match='\u2003'>
>>> re.search('\s+', s, re.ASCII)
>>>
^^^ # --> No match
>>> re.split('\s+', s)
['One', 'Two']
>>> re.split('\s+', s, re.ASCII)
['One', 'Two']
Bug?
Zum Verständnis: '\u2003' == em space, also ein Whitespace-Char in Unicode.
Chris