Benutzer-Werkzeuge

Webseiten-Werkzeuge


python:pandas

Datentypen

  • Scalar → im Prinzip ein einzelner Datenpunkt/Wert
  • Series → eine Spalte (eine Ansammlung von Scalaren)
  • DataFrame → eine Tabelle (eine Ansammlung von Scalaren)

Funktionen anwenden

Die im folgenden beschriebenen Funktionen, sind Funktionen von DataFrame, werden also immer als Funktionen eines konkreten DataFrame-Objektes aufgerufen.
Grundsätzlich scheinen sich die folgenden Funktionen praktisch in dem was sie können (welche Parameter sie akzeptieren) zu überlagern - wahrscheinlich wird im Hintergrund der gleiche Code aufgerufen.

a=DataFrame()
a.apply()

Funktion Beschreibung Inoffizielle Funktionen
applyFührt eine Funktion gegen eine Achse der Tabelle aus.
Die Funktion bekommt eine Serie (also im Prinzip ein Iterateable was die Werte liefert) übergeben.
Die Funktion soll ein Iterateable (also zum Beispiel eine Liste) zurückgeben.
Der Rückgabewert von apply lässt sich über den Parameter „result_type“ festlegen
Es kann durch Übergabe von {„Spaltenname“:Funktionsname} nur eine Spalte an die Funktion übergeben werden.
Praktisch kann die Funktion ein Iterateable erwarten oder einen Einzelwert pro Aufruf. In letzterem Fall wird der DataFrame (oder Serie) durchlaufen und die Funktion für jeden einzelnen Wert aufgerufen (bei 12 Elementen → 12 einzelne Aufrufe)
TransformFührt ein oder mehrere Funktionen gegen einen DataFrame oder bestimmte Spalten des selbigen aus. Das Ergebnis hat die gleiche Länge wie der Original-Data-Frame (es wird durch die Funktion erzwungen → Exception wenn zu kurz) und kann daher genutzt werden um die Daten im Original-DataFrame upzudaten.

Der Funktionsparameter kann eine Funktion, eine Liste von Funktionen oder {„Spaltenname“: Funktion} sein, womit sich festlegen lässt das eine Funktion nur auf eine bestimmte Spalte angewendet werden soll.
Die Funktion (also die übergebene) muss mind. eine Serie oder ein DataFrame zurückgeben
aggSoll Aggregate (z.B. Mittelwerte, Summen usw.) berechnen - also die übergebene Funktion soll es tun.
Der Funktionsparameter darf eine einzelne Funktion, eine Liste von Funktionen oder ein Dictionary der Form {„Spaltename“:Funktion} sein.
Der Rückgabewert der übergebenen Funktion kann ein einzelner Wert, eine Serie oder ein DataFrame sein.
mapFührt eine Funktion für jeden einzelnen Wert in einem DataFrame oder einer Spalte eines DataFrames durch.
Die übergebene Funktion liefert ein DataFrame oder eine Serie zurück
python/pandas.txt · Zuletzt geändert: 2025/05/22 17:28 von root