2016-05-05 7 views
-2

Ich bin im Grunde Migration von R nach Python. Ich wollte meinen Datenrahmen basierend auf einer Spalte unterteilen. Während des Stack-Overflows answer fand ich eine Lösung.Was ist der Zweck von .loc in Pandas Datenrahmen

Aber betrachten Sie den Code unten:

import pandas as pd 
import numpy as np 
df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(), 
        'B': 'one one two three two two one three'.split(), 
        'C': np.arange(8), 'D': np.arange(8) * 2}) 

df1 = df[df['A'] == "foo"] 
df1 
df2 = df.loc[df['A'] == "foo"] 
df2 

Beide DF1 und DF2 gleich sind.

Also meine Frage ist: Was ist die Voraussetzung für loc Funktion in erster Linie. Bitte beachten Sie, dass ich aus dem R-Hintergrund komme und in R nicht loc type function für das Subsetting von Datenframes verwenden muss.

+0

Bitte lesen [this] (http://pandas.pydata.org/pandas-docs/stable/indexing.html#different-choices-for-indexing) und [dies] (http: //pandas.pydata. org/pandas-docs/stable/indexing.html # indexing-view-versus-copy) Wenn Sie weitere Fragen haben, bearbeiten Sie Ihre Frage – EdChum

Antwort

1

Ich lerne selbst Pandas, also entschuldige die Antwort, die nicht besonders ausführlich ist. Das .loc hat eine 'location'-Funktion, die es ermöglicht, einen Platz im Datenrahmen DF [1,3] in R zu notieren. Oder es erlaubt Ihnen, zwei Gitterkoordinaten einzugeben, wo Sie sonst nur 1 Parameter haben könnten.

Jetzt könnte ich mich irren, da es schon eine Weile her ist, seit ich mir Pandas angeschaut habe, und wie ich erwähnt habe, lerne ich es auch nur.

Es aufgeführt wird als Indizierungsfunktion auf der Website http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.loc.html

1

Die loc Methode ermöglicht die direkten Zugriff auf den Datenrahmen für die Zuordnung zu bestimmten Orten des Datenrahmens zu ermöglichen. Dies steht im Gegensatz zu der ix-Methode oder Klammern-Notation, die eine Kopie des angeforderten Abschnitts des Datenrahmens erzeugt. Die Konsequenz ist, dass Sie über diese Methoden keine Zuordnung zum Datenrahmen vornehmen können. Die Iloc-Methode teilt das gleiche Merkmal wie loc.