<div dir="ltr"><div><div><div>I noticed that the excellent perl utility <a href="http://www.fourmilab.ch/webtools/unum/">unum</a> uses an obsolete unicode database.<br><br></div>Since I’m a Pythonista, i recalled hearing about the stdlib unicodedata module, using which I either wanted to rewrite unum or extend its database.<br><br></div>Unfortunately, unicodedata is very limited. Partly rightfully so, since you can convert codepoints and chars with chr() and ord(), and str.upper() and friends are unicode-aware.<br><br></div><div>But the name database is only queryable using full names! I want to do unicodedata.search('clock') and get a list of dozens of glyphs with names like CLOCKWISE RIGHTWARDS AND LEFTWARDS OPEN CIRCLE ARROWS<br> and CLOCK FACE THREE-THIRTY.<br><br></div><div>Maybe this should spit out a list of (name, char) tuples? or a {name: char} dict?<br><br></div><div>What do you mean?<br></div></div>