Am 08.10.25 um 12:44 schrieb Sukri Jusuf:
Danke für die Erklärung, das hilft, das Verhalten des Parsers besser zu verstehen. Ich arbeite aktuell an der Strukturierung eines Lexikons, in dem unter anderem Begriffe wie Suchmaschinenoptimierung (https://www.sumasearch.ch/lexikon/definition-suchmaschinenoptimierung/ ) technisch und inhaltlich sauber aufbereitet werden sollen.
Mir ging es dabei vor allem um die Frage, ob man bei automatisch generiertem HTML den ursprünglichen Whitespace gezielt erhalten kann, um den Quellcode lesbarer zu halten, ohne das Parsing oder Rendering zu beeinträchtigen. Der Hinweis auf Pretty-Printer war hilfreich; ich teste verschiedene Ansätze (z. B. html.parser und lxml) und freue mich über Beispiele, wie sich Whitespace gezielt steuern lässt.
Für html Seiten Erzeugung ( aus html-Vorlagen ) verwende ich eigene Python Programme. Wenn ich die ursprünglichen Whitespace erhalten wollte, würde ich ein entsprechend vom Programm einbauen lassen. -- <http://www.hermann-riemann.de> bzw.: <https://www.hermann-riemann.eu/de>