Type a search term to find related articles by LIMS subject matter experts gathered from the most trusted and dynamic collaboration tools in the laboratory informatics industry.
Der Begriff Zeilenumbruch stammt aus der elektronischen Textverarbeitung und gibt an, an welcher Stelle ein Text von einer Zeile in die nächste übergehen soll. Häufig spricht man nur kurz vom Umbruch.
Auf einer Schreibmaschine wird der Zeilenumbruch explizit durch Betätigen einer Taste oder eines Hebels durchgeführt. Dabei werden zwei Funktionen ausgeführt:
Bei der Einführung der Fernschreiber wurden verschiedene Steuerzeichen (Codierungen elektrischer Signale) eingeführt, um die Zeilenumbruchfunktion einer Schreibmaschine darzustellen. Diese sind dann auch, durch ihre Verwendung als erste Ausgabegeräte der Informatik, von der Fernmeldetechnik in die elektronische Datenverarbeitung übernommen worden.
Reine Textdateien auf dem Computer ähneln in ihrer Darstellung am Bildschirm anfangs einem auf einer Schreibmaschine geschriebenen Text, die Steuerzeichen sind für den Benutzer im Allgemeinen unsichtbar. Mit dem Scrollbalken geht der Zusammenhang zwischen Bildschirmbreite und Zeilenlänge verloren, mit den Proportionalschriften der zwischen Zeichenanzahl und Zeilenlänge. Ausführliche Funktionen haben die Zeichen für den Zeilenumbruch dann erst in der Textauszeichnung (Rich-Text-Format und ähnliches) bekommen.
Weil die Steuerzeichen noch in den Anfangsphasen der Computertechnik spezifiziert wurden, sind sie mit ihrer Funktionsänderung bis heute eine der großen Inkompatibilitäten zwischen verschiedenen Betriebssystem- und Anwendungssoftwaresystemen.
Unterschieden wird in der Textformatierung der Textverarbeitungssysteme zwischen einem Absatzwechsel und einem Zeilenwechsel, sowie zwischen hartem (manuellem) und weichem (automatischem) Zeilenumbruch. Die nachfolgend genannten Eingabemethoden und Steuerzeichen entsprechen den Konventionen verbreiteter Textverarbeitungsprogramme; abweichende Bedienung und Darstellung je nach System sind jedoch möglich.
<p>
und </p>
für paragraph.<br>
für (line) break.[1]<pre>
) oder die Anweisung kein automatischer Zeilenumbruch in der Absatzformatierung (in CSS white-space:nowrap;
früher auch mit dem nicht standardisierten HTML-Tag <nobr>
).Weitere Umbruchsituationen der Zeile ergeben sich sowohl beim Seitenwechsel (Ganzseitenumbruch) als auch beim Spaltensatz (Spaltenumbruch).
Im Druckwesen wird das Umbrechen der Zeilen unter Berücksichtigung von Spalten und Seiten sowie um Bildelemente, Grafiken und Ähnliches Mettage genannt. In der elektronischen Datenverarbeitung übernimmt dies die Textverarbeitungssoftware. Je leistungsfähiger letztere ist, desto schöner und lesbarer ist das Umbruchsbild.
Bei der Entwicklung des ASCII-Zeichensatzes wurden zwei Zeichen reserviert:
LF
) ist als ASCII-Zeichen 10 (hexadezimal 0A
) kodiert. Manche Systeme erlauben es, das LF
-Zeichen mit der Tastenkombination Strg+J einzugeben.CR
) ist als ASCII-Zeichen 13 (hexadezimal 0D
) kodiert. Manche Systeme erlauben es, das CR
-Zeichen mit der Tastenkombination Strg+M einzugeben.Es existieren verschiedene Standards, um den Zeilenumbruch in einer Textdatei explizit zu kodieren:
Betriebssystem | Zeichensatz | Abkürzung | Code Hex | Code Dezimal | Escape-Sequenz |
---|---|---|---|---|---|
Unix (BSD, macOS), Linux (Android), AmigaOS, weitere | ASCII | LF | 0A | 10 | \n |
Windows, DOS, OS/2, CP/M, TOS (Atari) | CR LF | 0D 0A | 13 10 | \r\n | |
Mac OS Classic, Apple II, C64 | CR | 0D | 13 | \r | |
AIX OS & OS/390 | EBCDIC | NL | 15 | 21 | \025 |
Auf IBM-Großrechnern ist der Zeilenumbruch in den Dateien kein Steuerzeichen. Vielmehr wird die Zeilenlänge im DCB (Recordformat F oder FB) beziehungsweise in einem Längenfeld am Zeilenanfang (Recordformat V oder VB) gespeichert.
Bei Mac OS X finden sich aufgrund der weitgehenden Kompatibilität zum Vorgänger Mac OS noch einige Textformate, die CR
statt LF
als Zeilentrenner verwenden. Viele moderne Mac OS X-Programme können daher mit beiden Formaten in Textdateien umgehen. Bei der Verwendung von falsch deklarierten Dateien, die CR LF
verwenden, führt dies bei einigen Programmen dazu, dass Zeilenumbrüche doppelt erzeugt werden. Lediglich Dateien, die aus der BSD- bzw. Unix-Welt stammen, sind meist zwingend an LF
als Zeilentrenner gebunden.
Für Unicode-Texte fordert der Unicode-Standard im Unicode-Zeilenumbruch-Algorithmus von Software, die unicodekonform sein soll, dass neben den oben genannten und in unicodekonformen Zeichenfolgen CR
, LF
und CR LF
folgende weitere Zeichen als Zeilenumbrüche erkannt werden:
Abkürzung | englische Bezeichnung | deutsche Bezeichnung | Codepoint |
---|---|---|---|
FF | Form Feed | Seitenvorschub (mit zwangsläufigem Umbruch der Zeile) | U+000C |
NEL | Next Line | Nächste Zeile | U+0085 |
LS | Line Separator | Zeilentrenner | U+2028 |
PS | Paragraph Separator | Absatztrenner | U+2029 |
Durch die verschiedenen Konventionen zum Kodieren der Formen des Zeilenumbruchs auf Computersystemen, die bei der Übernahme der Fernschreib-/Schreibmaschinen-Konventionen in die elektronische Textverarbeitung entstanden, treten beim Austausch zwischen unterschiedlichen Systemen Probleme auf.
Bekanntes Beispiel ist die Funktion printf()
bzw. fprintf()
aus der Standard C Library zum Schreiben in Dateien. Die Escape-Sequenz \n
(LF
) steht in C für einen Zeilenumbruch. Beim Schreiben in Dateien wird in C zwischen Textmodus und Binärmodus unterschieden. Bei im Textmodus geöffneten Dateien erfolgt eine Übersetzung von \n
in die auf dem jeweiligen System üblichen Steuerzeichen für den Zeilenumbruch. Somit erfolgt in unixartigen Betriebssystemen keine Umsetzung, da dort LF
bereits für den Zeilenumbruch steht. Dagegen findet unter Windows eine Substitution durch CR LF
statt. Die resultierenden Dateien sind folglich nicht identisch. Ist die Datei im Binärmodus geöffnet, erfolgt keine Übersetzung, sondern es wird stets ein LF
in die Datei geschrieben.
Bei Java stehen die Zeichenkonstanten (Escape-Sequenzen) \n
und \r
zur Verfügung; eine Umwandlung erfolgt nicht, stattdessen können mittels gesonderter Funktionen die plattformabhängigen Zeichen für den Zeilenumbruch eingefügt werden. Die neuere printf
-Funktion kennt den Formatierungscode %n
, um den plattformspezifischen Zeilentrenner auszugeben. Beim Einlesen ist die Java-Bibliothek tolerant und akzeptiert sowohl CR
, LF
als auch CR LF
als Zeilenende für readLine()
.[2] Wird eine EBCDIC-Codepage wie Cp500
verwendet, so wird das Byte EBCDIC NEL
(0x15) auf LF
(U+000A) und nicht etwa NEL
(U+0085) abgebildet.
Auch andere Programmiersprachen wie Visual Basic oder Perl stellen ähnliche Funktionalitäten zur Verfügung, um Textdateien korrekt zu verarbeiten.
Zahlreiche Netzwerkprotokolle zur Übertragung von Text, z. B. HTTP, SMTP oder FTP, definieren die Sequenz CR LF
für einen Zeilenumbruch. Einige Programme, z. B. Mail Transfer Agents, sind strikt und verweigern sogar die Verarbeitung von Daten mit alleinstehenden LFs („Bare LF“).[3] Andere Protokolle empfehlen jedoch, auch ein einzelnes LF
als (ggf. weichen) Umbruch zu interpretieren. In der W3C-Recommendation zu XML ist in Abschnitt 2.11[4] definiert, wie Zeilenumbrüche zu handhaben sind. In der Version 1.1 sind hier U+0085 und U+2028 hinzugekommen.
Ein typografischer Umbruch, der unterdrückt wird, wird etwa in Poesiezitaten bei Zeilenzitation verwendet:
„Ich saz ûf eime steine / und dahte bein mit beine, / dar ûf satzt ich den ellenbogen; […]“
Damit (Virgel) werden etwa die Reime markiert, deutlichere Absätze wie Strophen kann man dann mit «//» setzen.
Umgekehrt kann es in der elektronischen Textverarbeitung notwendig sein, einen entstehenden Zeilenumbruch als unerwünscht zu markieren. Das entsteht z. B. in Programmiersprachen, in denen der Umbruch ein Steuerzeichen ist, aber etwa auch bei der Angabe von URLs (Webadressen). Hier verwendet man etwa «_» (underline), «\» (backslash), je nachdem, was im jeweiligen Format nicht als Steuerzeichen anderweitig besetzt ist, oder auch das Zeichen wie «↩» (U+21A9). Das Zeichen «↩» ist hier eine printtypografische Anweisung „Umbruch ignorieren“ – bei Copy and paste der Textstelle etwa in die Adresszeile eines Browsers wird der Teil nach dem Zeilenumbruch von manchen Programmen ignoriert, andere fügen den Weblink wieder zusammen, dann müsste das Zeichen «↩» manuell entfernt werden – im rein elektronischen Medium ist das Zeichen eher störend.
Beim Korrekturlesen im Druckwesen verwendet man die Korrekturzeichen «» für fehlenden und «» für unerwünschten Absatz (‚Zeilenumbruch einfügen‘, bzw. ‚Zeilenumbruch entfernen‘, also ‚Absatz anhängen‘):[5]