Pandas eignet sich hervorragend für die Behandlung eines sehr breiten Spektrums von Anwendungsfällen in der Datenanalyse. Es kann ein wenig entmutigend sein, die Dokumentation zu erforschen, um herauszufinden, was der beste Weg ist, um eine bestimmte Aufgabe auszuführen.Unterschied (e) zwischen merge() und concat() in Pandas
Ich versuche derzeit, den wesentlichen Unterschied (en) zwischen pd.DataFrame.merge()
und pd.concat()
zu verstehen. So weit kann ich artikulieren:
.merge()
kann nur Spalten (plus Zeilen Indizes) verwenden und es ist semantisch für Datenbank-Stil Operationen geeignet. .concat()
kann mit beiden Achsen verwendet werden, wobei nur Indizes verwendet werden, und bietet die Option zum Hinzufügen eines hierarchischen Index.
Übrigens ermöglicht dies die folgende Redundanz: beide können zwei Datenrahmen mit den Zeilenindizes kombinieren.
Und wie für pd.DataFrame.join()
, es scheint, es bietet nur eine Kurzschrift für eine Teilmenge der Anwendungsfälle von .merge()
.
Könnte jemand bitte kommentieren, wie vollständig und genau mein Verständnis zu diesem Zeitpunkt ist?
Vielen Dank.
Auch bezogen werden: http://stackoverflow.com/a/37891437/1972495 eine Diskussion um '' '' .merge() '' '' und '' '' .join() '' ''. – WindChimes