Hallo, liebe Pythonier, das “Daumenspiel”, vor allem meine Behauptung, "Keyboard coding" erfasse alle Unicode-Zeichen, muss einmal mit folgenden Hinweisen, auf sichere Grundlagen gestellt werden: Die IT erfordert zur elektronischen Übertragung von Informationen das Zahlensystem zur Basis 2 mit der Einheit von bits (0 und 1). Dabei stellen 8-bit ein 1 Byte dar. 2 Byte (16 bit) ermöglichen 256 Alternative, die mit dem Zahlensystem zur Basis 16 (2^8 hexadezimal) organisiert werden können. Wie sich herausgestellt hat, kann das Zahlensystem zur Basis 16 nicht die Obergrenze sein für die serielle Ordnung von Sachverhalten mit Zahlen (z.B. Unicode-Zeichen). Die beiden höchsten Ziffern des Systems “ff” erfassen nur 256 Zeichen. Für mehr Zeichen sind entweder mehr Bytes oder höhere Zahlensysteme erforderlich. Höhere Ordnungssysteme können nur mit mehr als 2^8 Ziffern erreicht werden, und das sind: 2^9, 2^10, 2^11 und 2^12. Für die letzere Variante bestehen 4096 Ziffern, denn mit 2 Ziffern “ gf “, (darstellbar mit 16 bit) werden 65535 Zeichen angesprochen, das sind fast alle verwendeten Unicode-Zeichen. Was zu beweisen wäre. Für mehr Einzeilheiten, z.B. über die "Codepage” als Organisationsschritt zur Zeichenkodierung, stehe ich jederzeit zur Verfügung. (eschnoor@multi-matrix.de)
Wie sich herausgestellt hat, kann das Zahlensystem zur Basis 16 nicht die Obergrenze sein für die serielle Ordnung von Sachverhalten mit Zahlen (z.B. Unicode-Zeichen). Die beiden höchsten Ziffern des Systems “ff” erfassen nur 256 Zeichen. Für mehr Zeichen sind entweder mehr Bytes oder höhere Zahlensysteme erforderlich.
Höhere Ordnungssysteme können nur mit mehr als 2^8 Ziffern erreicht werden, und das sind: 2^9, 2^10, 2^11 und 2^12. Für die letzere Variante bestehen 4096 Ziffern, denn mit 2 Ziffern “ gf “, (darstellbar mit 16 bit) werden 65535 Zeichen angesprochen, das sind fast alle verwendeten Unicode-Zeichen. Was zu beweisen wäre.
„Was zu beweisen wäre.“ – WÄRE. Nicht WAR. In der Tat wäre da einiges zu beweisen. Oder besser: sorgfältig zu begründen oder zumindest klar und deutlich zu erklären. Nämlich mindestens dieses: (1) Warum soll denn die Anzahl der Zahlzeichen auf zwei beschränkt werden ('FF'bei Hex-Zahlzeichen, 'GF' bei 4096-Zahlzeichen)? (2) Warum sind zweiziffrige 4096-Zahlzeichen 16-bittig? (3) Warum kann man mit einem solchen Ziffernpaar exakt 65.535 verschiedene Zahlzeichen darstellen? Müssten es nicht eigentlich 4096^2 = 16.777.216 sein? Analog den zweiziffrigen Hex-Zahlenzeichen, wovon es 16^2 = 256 gibt? (4) Warum soll man zum Durchnummerieren der Unicodezeichen ein auf 4096 Ziffern erweitertes („aufgeblasenes“) Zahlensystem verwenden? Alle Unicodezeichen sind doch mit dem Hex-System durchnummeriert. Und sie sind damit eindeutig identifizierbar (z.B. das Unicode-Zeichen „€“ (U+20AC)). (5) Wie viele Unicode-Zeichen gibt es? Und welchen Anteil daran haben die eben erwähnten Zahlzeichenpaare des 4096-Zahlensystems? Sind das wirklich fast alle?
Unsub
Am 12.07.2024 um 16:02 schrieb Wolli Buechel über python-de <python-de@python.org>:
Wie sich herausgestellt hat, kann das Zahlensystem zur Basis 16 nicht die Obergrenze sein für die serielle Ordnung von Sachverhalten mit Zahlen (z.B. Unicode-Zeichen). Die beiden höchsten Ziffern des Systems “ff” erfassen nur 256 Zeichen. Für mehr Zeichen sind entweder mehr Bytes oder höhere Zahlensysteme erforderlich.
Höhere Ordnungssysteme können nur mit mehr als 2^8 Ziffern erreicht werden, und das sind: 2^9, 2^10, 2^11 und 2^12. Für die letzere Variante bestehen 4096 Ziffern, denn mit 2 Ziffern “ gf “, (darstellbar mit 16 bit) werden 65535 Zeichen angesprochen, das sind fast alle verwendeten Unicode-Zeichen. Was zu beweisen wäre.
„Was zu beweisen wäre.“ – WÄRE. Nicht WAR.
In der Tat wäre da einiges zu beweisen. Oder besser: sorgfältig zu begründen oder zumindest klar und deutlich zu erklären. Nämlich mindestens dieses:
(1) Warum soll denn die Anzahl der Zahlzeichen auf zwei beschränkt werden ('FF'bei Hex-Zahlzeichen, 'GF' bei 4096-Zahlzeichen)?
(2) Warum sind zweiziffrige 4096-Zahlzeichen 16-bittig?
(3) Warum kann man mit einem solchen Ziffernpaar exakt 65.535 verschiedene Zahlzeichen darstellen? Müssten es nicht eigentlich 4096^2 = 16.777.216 sein? Analog den zweiziffrigen Hex-Zahlenzeichen, wovon es 16^2 = 256 gibt?
(4) Warum soll man zum Durchnummerieren der Unicodezeichen ein auf 4096 Ziffern erweitertes („aufgeblasenes“) Zahlensystem verwenden? Alle Unicodezeichen sind doch mit dem Hex-System durchnummeriert. Und sie sind damit eindeutig identifizierbar (z.B. das Unicode-Zeichen „€“ (U+20AC)).
(5) Wie viele Unicode-Zeichen gibt es? Und welchen Anteil daran haben die eben erwähnten Zahlzeichenpaare des 4096-Zahlensystems? Sind das wirklich fast alle? _______________________________________________ python-de Mailingliste -- python-de@python.org Zur Abmeldung von dieser Mailingliste senden Sie eine Nachricht an python-de-leave@python.org https://mail.python.org/mailman3/lists/python-de.python.org/ Mitgliedsadresse: gherman@darwin.in-berlin.de
participants (3)
-
Dinu Gherman
-
Erich Schnoor
-
Wolli Buechel