Sed

Aus wiki.archlinux.de


Sed (stream editor) ist ein nicht interaktiver Texteditor oder anders ausgrdückt ein steuerbares Filter.

Konzept

Das Konzept hinter sed ist, Text von der Standardeingabe mit Hilfe variabler Regeln (vor allem unter Benutzung regulärer Ausdrücke) in modifizierten Text auf der Standardausgabe zu überführen. Man kann mit sed Text säubern, extrahieren, zurechtschneiden, erweitern, vertauschen und all diese Prozesse automatisieren. Sed eignet sich immer dann, wenn Textbearbeitungen wiederholt ablaufen müssen.

Sed überschneidet sich in einigen Aspekten mit awk und mit perl. Im Gegensatz zu perl besitzt sed keine wirklichen Variablen und Steueranweisungen. Man wird keine Programme für sed schreiben, die diesen Namen wert sind. Aus diesem Grunde ist sed aber auch weit weniger komplex. Man hat üblicherweise in ein paar Minuten brauchbare Ergebnisse.

Viele sed-Kommandos kann man zudem auch in vi oder ed interaktiv verwenden, was ihm eine steile Lernkurve beschert. Wer vi mit regulären Ausdrücken beherrscht, beherrscht im Prinzip auch sed.

Installation

Sed wird wie folgt installiert:

pacman -Sy sed

Danach ist er sofort voll funktionsfähig.

Bedienung

Man startet sed üblicherweise mit Ein- und Ausgabeumleitung:

sed -e "..."  < Eingabedatei > Ausgabedabei
sed -f script < Eingabedatei > Ausgabedatei

Die erste Variante führt einen einzelnen Ausdruck aus, den man hinter -e angibt. In vielen Fällen mag dies ausreichend sein. Wird der Ausdruck komplizierter, oder will man mehrzeilige oder mehrere Ausdrücke verwenden, so schreibt man diese üblicherweise in eine einfache Textdatei und übergibt sed diese Textdatei hinter -f. Sed führt dann nacheinander Zeile für Zeile aus und wendet Ausdruck für Ausdruck auf die Eingabedaten an.

Man prüfe sed beispielsweise durch folgenden Aufruf

sed -e"s/ein/kein/"

und schreibe dann einen Text mit dem Wort "ein"

Dies ist ein schöner Text. [Enter]

Sed antwortet umgehend mit der transformierten Zeile

Dies ist kein schöner Text.

und wartet auf weitere Eingaben. Man beendet einen solcherart interaktiv gestarteten sed am besten mit Ctrl-C.

Hinweis: wenn man sed irrtümlich ohne Parameter startet, so wartet er auf Text - er liest von der Standardeingabe und gibt wahrscheinlich jedes eingegebene Zeichen unverändert auf dem Bildschirm aus, denn man hat ja auch keinen Ausdruck angegeben, mit dem der Text bearbeitet werden soll. (GNU sed erkennt diesen Fall und beendet sich gleich selbst.)

Einsatzfälle

Typische Einsatzfälle liegen in der Bearbeitung großer Textdateien, vor allem Log-Dateien. So läßt sich eine megabytegroße Log-Datei innerhalb von einer Sekunde auf ein paar Kilobyte zurechtschneiden, die nur noch die Zeilen eines bestimmten Tages oder TRACE-Zeilen einer bestimmten Funktion enthält.

Ein weiterer Fall ist die Nachbearbeitung von generierten Quelldateien, z.B. solcher von flex, bison oder gSOAP. Gelegentlich muß man ein #include hinzufügen oder ein #ifdef. Sed erledigt das vollautomatisch und immer wieder in der gleichen Qualität sofort im Anschluß an die Generierung.

Einfache Konvertierungen. Obwohl heute für viele Dinge auch echte Konvertierprogramme existieren, beispielsweise iconv für Zeichensätze, kann man einfache Transformationen auch mit sed ausführen, beispielsweise DOS/UNIX-Zeilenenden ineinander umwandeln oder (und da wird's gleich interessant) eine Datumsschreibweise in eine andere.

Links