Fwd: Codepage-Methode vs. UTF8

Hallo, Herr Büchel, eine schriftliche Zusammenfassung der Codepage-Methode ist noch in Arbeit. Hier die Grundlagen für neue Erkenntnisse: _____________________________ _______________________________ "Seit Einführung der Unicode-Tabelle ist die Zeichencodierung (codepage, charset) der wichtigste Schritt in der Informatik. Die Codierung geschieht grundsätzlich nach den Regeln des Unicode Transformation Formats (UTF). Die Zeichen werden mit ihrem <point> in Bytes aufgerufen [#1]. Die gesamte Unicode-Tabelle stellt eine einheitliche Codepage dar. Diese Erkenntnis ist jedoch neu. Für eine Codepage sind zwei Merkmale erforderlich: „skalierbarer Sachverhalt“ „sachbezogenes Ordnungssystem“ Für das gesamte Unicode-Verfahren sind diese Voraussetzungen erfüllt. Die Zeichen aller Sprachen sind in einer skalierbaren Reihenfolge geordnet und werden in einem sachgerechten Ordnungssystem aufgerufen (Zahlensysteme zur Basis 10, 16). Allerdings gilt das nur für definierte Codeages und die dort erfassten Unicode-Zeichen ((z.B: ISO/IEC 8859-1/www. cscvt.de). n diesem Bereich zeigt die Informatik eine essenzielle Lücke: Zahlensysteme oberhalb der Basis 16 und darauf aufbauende Schritte werden bisher nicht benutzt. Das Zahlensystem zur Basis 4096 ist von besonderer Bedeutung. Es bildet die Grundlage für eine neue Zeichenkodierung mit einem String von 4096 Zeichen: Zahlenstring: 123456789Abcdefghijklmno . . . . . . . . . .. . . . . . . . . . . . . .ꮌꮍꮎꮏꮐꮑꮒꮓꮔꮕꮖꮗꮘꮙꮚꮛꮜ Die Zeichen des Strings als<index>Ziffern ersetzen die bisherigen <point>Zahlen. Für die Kodierung von Unicode-Zeichen sind nur 1 oder 2 Byte (16 bit) erforderlich. Von <point>256 bis <point>65535 genügen zweistellige <index>Ziffern. Mit 3 Bytes (24 bit) werden die <points> von 65536 bis 16777215 angesprochen. Die Position der Ziffer im String stellt ihren <index> Wert dar. Die Kodierung führt zu identischen Binärziffern wie <point>Zahlen.” _____________________________________________________________
Anfang der weitergeleiteten Nachricht:
Von: Wolfgang J. Büchel <wjb131@web.de> Betreff: Aw: [Python-de] Codepage-Methode vs. UTF8 Datum: 17. August 2024 um 18:06:22 MESZ An: Erich Schnoor <eschnoor@multi-matrix.de>
Hallo Herr Schnoor,
wie geht denn das CPM-Verfahren? Gibt es darüber eine gute Darstellung?
mfg W. Büchel
Am 17.08.24 um 14:19 schrieb Erich Schnoor über python-de:
Hallo, sehr geehrter Herr Büchel,
Sie schreiben:
Da wird lediglich jede Indexzahl in eine äquivalente Dezimalzahl unmgewandelt.
Dies zeigt auch der mir zugesandte Programmcode der Datei Zahlensysteme.py:
Das ist ja wohl auch die Aufgabe eines jeden Zahlensystems ! Nur eines wird mir hier klar: Sie argumentieren offensichtlich ausschließlich im bekannten “UTF-8”-Verfahren, während ich versuche, den im neu entdeckten Informatik-Bereich - . hier mit “CPM”-Verfahren bezeichnet - zu arbeiten. Dazu würde ich gern Ihre Meinung erfahren?
Mit freundlichen Grüßen Erich Schnoor
_______________________________________________ python-de Mailingliste -- python-de@python.org <mailto:python-de@python.org> Zur Abmeldung von dieser Mailingliste senden Sie eine Nachricht an python-de-leave@python.org <mailto:python-de-leave@python.org> https://mail.python.org/mailman3/lists/python-de.python.org/ Mitgliedsadresse: wjb131@web.de <mailto:wjb131@web.de>
participants (1)
-
Erich Schnoor