Lange Zeilen mit einem Shell-Befehl umbrechen

24.10.2009 Linux, Merkblätter Kommentieren

Grade was die Bearbeitungen von Textdateien angeht, gibt es wohl kaum etwas, was man nicht mit einem mehr oder weniger einfachen Shell-Befehl erledigen könnte. Wenn man allerdings erst nach dem Durchbruch der grafischen Benutzeroberfläche die Vorteile von Linux zu schätzen gelernt hat (also wie ich, noch nicht alle der gefühlt fünf Milliarden Befehle kennt), fällt einem auch oft genug nicht sofort das passende Suchwort ein, welches zum entsprechenden Befehl und dessen Beschreibung in den manpages führt. Gut, wenn man nach erfolgreicher Suche die Beschreibung dann für später einfach in seinem Blog ablegt.

NAME
  fold - Jede Eingabezeile an bestimmter Stelle umbrechen

ÜBERSICHT
  fold [OPTION]... [DATEI]...

BESCHREIBUNG
  Brich Eingabezeilen jeder DATEI um (Voreinstellung
  Standardeingabe), gib das Ergebnis auf Standardausgabe
  aus.

  -b, --bytes
    zähle Bytes anstatt Spalten

  -s, --spaces
    Umbruch bei Leerzeichen

  -w, --width=BREITE
    benutze BREITE Spalten anstatt 80

  --help
    gib eine kurze Hilfe aus und beende das Programm

  --version
    gib Versionsinformation aus und beende das Programm

In diesem Fall habe ich den Befehl übrigens für die Aufbereitung von Dummy-Texten benötigt, mit denen ich anschließend die Performance der Indexgenerierung der LuceneImplementierung des Zend-Frameworks in Zusammenhang mit einem Projekt getestet habe. Dazu habe ich Texte des Project Gutenberg von Sonderzeichen und Leerzeilen befreit, um sie anschließend in die Datenbank zu importieren.

Für die Entfernung von Sonderzeichen und Zeilenumbrüchen, eignet sich im Übrigen der Befehl „tr“. So lassen sich zum Beispiel alle Zeilenumbrüche wie folgt entfernen (also durch Leerzeichen ersetzen):

tr \\n ' ' < in.txt > out.txt

Im Gegensatz zu grafischen Editoren, wie gedit oder Geany, die etwas zäh oder unerwartet reagieren, bekommt man auch keine Probleme, wenn sich der Inhalt einer mehreren Megabyte großen Textdatei in einer einzelnen Zeile befindet.

Es wird übrigens wirklich Zeit, dass die eBook-Hardware ihren Kinderschuhen entwächst. Die freien elektronischen Bücher des Project Gutenberg sind nämlich eigentlich viel zu schade, um sie als Dummy-Texte zu missbrauchen. Zumal viele bereits im EPUB-Format vorliegen.

Dein Kommentar

Zum Seitenanfang