Lange Zeilen mit einem Shell-Befehl umbrechen
Grade was die Bearbeitungen von Textdateien angeht, gibt es wohl kaum etwas, was man nicht mit einem mehr oder weniger einfachen Shell-Befehl erledigen könnte. Wenn man allerdings erst nach dem Durchbruch der grafischen Benutzeroberfläche die Vorteile von Linux zu schätzen gelernt hat (also wie ich, noch nicht alle der gefühlt fünf Milliarden Befehle kennt), fällt einem auch oft genug nicht sofort das passende Suchwort ein, welches zum entsprechenden Befehl und dessen Beschreibung in den manpages führt. Gut, wenn man nach erfolgreicher Suche die Beschreibung dann für später einfach in seinem Blog ablegt.
NAME fold - Jede Eingabezeile an bestimmter Stelle umbrechen ÜBERSICHT fold [OPTION]... [DATEI]... BESCHREIBUNG Brich Eingabezeilen jeder DATEI um (Voreinstellung Standardeingabe), gib das Ergebnis auf Standardausgabe aus. -b, --bytes zähle Bytes anstatt Spalten -s, --spaces Umbruch bei Leerzeichen -w, --width=BREITE benutze BREITE Spalten anstatt 80 --help gib eine kurze Hilfe aus und beende das Programm --version gib Versionsinformation aus und beende das Programm
In diesem Fall habe ich den Befehl übrigens für die Aufbereitung von Dummy-Texten benötigt, mit denen ich anschließend die Performance der Indexgenerierung der Lucene–Implementierung des Zend-Frameworks in Zusammenhang mit einem Projekt getestet habe. Dazu habe ich Texte des Project Gutenberg von Sonderzeichen und Leerzeilen befreit, um sie anschließend in die Datenbank zu importieren.
Für die Entfernung von Sonderzeichen und Zeilenumbrüchen, eignet sich im Übrigen der Befehl „tr“. So lassen sich zum Beispiel alle Zeilenumbrüche wie folgt entfernen (also durch Leerzeichen ersetzen):
tr \\n ' ' < in.txt > out.txt
Im Gegensatz zu grafischen Editoren, wie gedit oder Geany, die etwas zäh oder unerwartet reagieren, bekommt man auch keine Probleme, wenn sich der Inhalt einer mehreren Megabyte großen Textdatei in einer einzelnen Zeile befindet.
Es wird übrigens wirklich Zeit, dass die eBook-Hardware ihren Kinderschuhen entwächst. Die freien elektronischen Bücher des Project Gutenberg sind nämlich eigentlich viel zu schade, um sie als Dummy-Texte zu missbrauchen. Zumal viele bereits im EPUB-Format vorliegen.