<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Tue, Jan 16, 2018 at 9:30 PM, Stephen J. Turnbull <span dir="ltr"><<a href="mailto:turnbull.stephen.fw@u.tsukuba.ac.jp" target="_blank">turnbull.stephen.fw@u.tsukuba.ac.jp</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">In what context?  WHAT-WG's encoding standard is *all about browsers*.<br>
If a codec is feeding text into a process that renders them all as<br>
glyphs for a human to look at, that's one thing.  The codec doesn't<br>
want to fatal there, and the likely fallback glyph is something from<br>
the control glyphs block if even windows-125x doesn't have a glyph<br>
there.  I guess it sort of makes sense.<br></blockquote><div><br></div><div>sure it does -- and python is not a browser, and python itself has nothigni visual -- but we sure want to be abel to write code that produces visual representations of maybe messy text...</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">if you're feeding a program </blockquote><div>... </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">the codec has no idea when or how that's<br>
going to get interpreted.</blockquote><div><br></div><div>sure -- which is why others have suggested that if WATWG is supported, then it *should* only be used for encoding, not encoding. But we are supposed to be consenting adults here -- I see no reason to prevent encoding -- maybe it would be useful for testing???</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">(as with JSON data, which I believe is<br>"supposed" to be UTF-8, but many developers use the legacy charsets<br>they're used to and which are often embedded in the underlying<br>databases etc, ditto XML), </blockquote><div><br></div><div>OK -- if developers do the wrong thing, then they do the wrong thing -- we can't prevent that!</div><div><br></div><div>And Python's lovely "text is unicode" model actually makes that hard to do wong. But we do need a way to decode messy text, and then send it off to JSON or whatever properly encoded.</div><div><br></div><div>-CHB</div><div><br></div><div><br></div></div>-- <br><div class="gmail_signature"><br>Christopher Barker, Ph.D.<br>Oceanographer<br><br>Emergency Response Division<br>NOAA/NOS/OR&R            (206) 526-6959   voice<br>7600 Sand Point Way NE   (206) 526-6329   fax<br>Seattle, WA  98115       (206) 526-6317   main reception<br><br><a href="mailto:Chris.Barker@noaa.gov" target="_blank">Chris.Barker@noaa.gov</a></div>
</div></div>