Benutzer-Werkzeuge

Webseiten-Werkzeuge


awk

Dies ist eine alte Version des Dokuments!


Konzept

awk ist Zeilenorientiert - alle Anweisungen (außer Begin und End) auf die aktuell eingelesene Zeile angewendet. Anschließend wird die nächste Zeile eingelesen und das gleiche wiederholt.

Jede Zeile (Record) wird in Felder (Fields) zerlegt, auf die über Variablen $1 bis $x zugegriffen werden kann.

Die Zeichen anhand der das Ende eines Rekord (Zeile) erkannt wird kann frei definiert werden, gleiches gilt das Zeichen anhand dessen die einzelnen Fields (Felder) separiert werden - Default: New Line-Character bzw. Space.

  • Zeilenorientiert
    • eine Zeile = ein Record
    • Das Zeichen welches einen Record beendet ist frei definierbar
      • per Default: New Line-Zeichen
  • Auftrennung des Records in Fields (Felder)
    • auf die einzelnen Felder kann über Variablen zugegriffen werden
    • das Zeichen zum Auftrennen in Felder kann frei definiert werden
      • per Default ist es ein Leerzeichen

Aufbau

Syntax:

BEGIN {
             Code;
}


/PATTERN/{
        Code;
}


END{
       Code;
}
  • BEGIN und END sind optional und werden jeweils am Anfang und Ende des gesamten Scriptes ausgeführt
    • diese Funktionen werden also nicht für jede Zeile ausgeführt
    • können beliebige Aktionen/Code enthalten, die nur vor dem Einlesen der ersten Zeile und nach dem alle Zeilen eingelesen wurden, ausgeführt werden



  • alle anderen Funkionen werden immer ausgeführt - für jede Zeile die eingelesen wird
  • die /Pattern/ sind Bedingungen die gegeben sein müssen, damit die Action (der darauffolgende Code Block) ausgeführt wird - so wie if-Anweisungen.
    • Pattern sind optional, Actions ohne Pattern davor werden immer ausgeführt

Pattern/Bedingungen

Es gibt mehrere Bedingungen bzw. Gestaltungsmöglichkeiten dieser.

BEGIN/END

  • der Code-Block wird am Anfang des Scripts bzw. am Ende der Ausführung des Scripts ausgeführt

BEGINFILE/ENDFILE

  • Der Code-Block wird am Anfang oder Ende einer jeden Eingabedatei ausgeführt
  • Man kann awk mehrere Dateien als Argument übergeben

Regular Expression

Syntax:

/Regular Expression/{
some Code
}


Beispiel:

/192.168.20.[0-9]/{
some Code
}


Beispiel matcht wenn die IP mit 192.168.20 beginnt und auf 0-9 endet.

  • Supported werden extended Regular Expressions (siehe man Page)
  • Regular-Expressions müssen immer innerhalb von / / stehen (auch wenn sie mit anderen Anweisungen kombiniert werden)
  • der Code-Block wird ausgeführt wenn der Regular Expression auf die aktuelle Zeile zutrifft
    • Achtung es reicht wenn der Regular-Expression irgendwo auf der Zeile zutrifft. Es muss nicht die ganze Zeile zutreffen → 192.168.20.[0-9] würde auch matchen wenn die Zeile: „Dies ist die IP-Adresse:

192.168.20.9“ heißt.

Relational Expression

Sind komplexere Bedingungen bei denen gegen Feld-Variablen oder andere Variablen geprüft werden kann.
Mehrere Bedingungen können verknüpft werden.

Syntax:

Variable Vergleichsoperator Ausdruck{
Code
}
<code>
\\ \\

==== Variablen ====

Es gibt 3 Arten von Variablen.

**Fields**

  * enthalten den Inhalt von Feldern
    * werden als $1-$x angesprochen (die Felder sind durchnummeriert)
      * die Benamung ist auch beim Ändern/setzen von Werten so
    * $0 enthält den gesamten Record/Zeile

**Built-In**
  * Variablen deren Inhalt durch awk gesetzt werden
      * haben normale Namen (ohne irgend etwas davor)

Einige Variablen:

^Name ^Beschreibung ^
|FS|Field Separator - Definiert das Trennzeichen bzw. den Regular Expression zum Trennen der Fields/Felder.|
|RS|Record Separator - Definiert das Trennzeichen bzw. den Regular Expression zum Trennen der Records/Zeilen|






 * match-Funktionen ergeben auch true wenn nur ein Teilstring gematcht wird
      * Reguläre Ausdrücke müssen nicht so konstruiert werden das sie den gesamten String erfassen, sondern es reicht wenn sie auf einen zusammenhängenden Teilstring passen 
  * FS -> Field-Seperator kann nur in BEGIN definiert werden
      * hat keinen Effekt wenn es später deklairert wird
  * Arrays werden ohne voran gestelltes $ angesprochen - sowohl bei Zuweisung, als auch bei lesendem Zugriff
  * { muss direkt nach dem Bereichs-Funktionskopf stehen -> darf nicht in der nächsten Zeile stehen


===== Grundaufbau =====

Syntax:
<code>
BEGIN {
             Code;
}


/PATTERN/{
        Code;
}


END{
       Code;
}
  • Pattern: Regulärer Ausdruck (oder etwas anderes?), Funktionsname → dann ist es eine Funktion die später aufgerufen werden kann, oder gar nichts → dann wird es immer ausgeführt.
awk.1504729032.txt.gz · Zuletzt geändert: 2017/09/06 22:17 von root