Sed: Unterschied zwischen den Versionen
K Nur ein kleines Leerzeichen im 2. Beispiel |
K Kategorie hinzugefügt |
||
Zeile 42: | Zeile 42: | ||
[[Kategorie:Editoren]] | [[Kategorie:Editoren]] | ||
[[Kategorie:Grundlagen]] | [[Kategorie:Grundlagen]] | ||
[[Kategorie:Befehle]] |
Version vom 14. Oktober 2020, 05:01 Uhr
sed (stream editor) ist ein nicht interaktiver Texteditor oder anders ausgedrückt: ein steuerbarer Filter.
Konzept
Das Konzept hinter sed ist, Text von der Standardeingabe mit Hilfe variabler Regeln (vor allem unter Benutzung regulärer Ausdrücke) in modifizierten Text auf der Standardausgabe zu überführen. Man kann mit sed Text säubern, extrahieren, zurechtschneiden, erweitern, vertauschen und all diese Prozesse automatisieren. sed eignet sich immer dann, wenn Textbearbeitungen wiederholt ablaufen müssen.
sed überschneidet sich in einigen Aspekten mit awk und mit perl. Im Gegensatz zu perl besitzt sed keine wirklichen Variablen und Steueranweisungen. Man wird keine Programme für sed schreiben, die diesen Namen wert sind. Aus diesem Grunde ist sed aber auch weit weniger komplex. Man hat üblicherweise in ein paar Minuten brauchbare Ergebnisse.
Viele sed-Kommandos kann man zudem auch in vi oder ed interaktiv verwenden, was ihm eine steile Lernkurve beschert. Wer vi mit regulären Ausdrücken beherrscht, beherrscht im Prinzip auch sed.
Installation
Das Programm ist als
sed
in core
verfügbar, und kann von dort
mittels Pacman
installiert werden.
Bedienung
Man startet sed üblicherweise mit Ein- und Ausgabeumleitung:
sed -e "..." < Eingabedatei > Ausgabedatei sed -f script < Eingabedatei > Ausgabedatei
Die erste Variante führt einen einzelnen Ausdruck aus, den man hinter -e angibt. In vielen Fällen mag dies ausreichend sein. Wird der Ausdruck komplizierter, oder will man mehrzeilige oder mehrere Ausdrücke verwenden, so schreibt man diese üblicherweise in eine einfache Textdatei und übergibt sed diese Textdatei hinter -f. sed führt dann nacheinander Zeile für Zeile aus und wendet Ausdruck für Ausdruck auf die Eingabedaten an.
Die Standardeingabe funktioniert selbstverständlich auch interaktiv. Man prüfe sed beispielsweise durch folgenden Aufruf
sed -e "s/ein/kein/g"
und schreibe dann einen Text mit dem Wort "ein"
Dies ist ein schönes Bein. [Enter]
sed antwortet umgehend mit der transformierten Zeile
Dies ist kein schönes Bkein.
und wartet auf weitere Eingaben. (Der aufmerksame Leser bemerkt gleich eine kleine Schwierigkeit ...) Man beendet einen solcherart interaktiv gestarteten sed am besten mit Ctrl-C.
Achtung: es führt wahrscheinlich zu einem sehr ärgerlichen Fehler, wenn man versucht, ein und dieselbe Datei als Ein- und Ausgabe zu verwenden. Diese wird dabei zerstört! Soll eine Datei umgewandelt werden und dabei ihren Namen behalten, so ist dies nur über den Umweg einer temporären Datei möglich:
sed -f script < file > tmp mv -f tmp file
Einsatzfälle
Typische Einsatzfälle liegen in der Bearbeitung großer Textdateien, vor allem Log-Dateien. So lässt sich eine megabytegroße Log-Datei innerhalb von einer Sekunde auf ein paar Kilobyte zurechtschneiden, die nur noch die Zeilen eines bestimmten Tages oder TRACE-Zeilen einer bestimmten Funktion enthält.
Ein weiterer Fall ist die Nachbearbeitung von generierten Quelldateien, z.B. solcher von flex, bison oder gSOAP. Gelegentlich muss man ein #include hinzufügen oder ein #ifdef. sed erledigt das vollautomatisch und immer wieder in der gleichen Qualität sofort im Anschluss an die Generierung.
Einfache Konvertierungen. Obwohl heute für viele Dinge auch echte Konvertierprogramme existieren, beispielsweise iconv für Zeichensätze, kann man einfache Transformationen auch mit sed ausführen, beispielsweise DOS/UNIX-Zeilenenden ineinander umwandeln oder (und da wird's gleich interessant) eine Datumsschreibweise in eine andere.