2015-05-19 10 views
25

Ich versuche, nach dem ich exampleSeaborn load_dataset

eine gruppierte boxplot arbeitet mit Seaborn zu bekommen kann das obige Beispiel bekommen arbeiten, aber die Zeile:

tips = sns.load_dataset("tips") 

ist überhaupt nicht erklärt. Ich habe die tips.csv-Datei gefunden, aber ich kann anscheinend keine angemessene Dokumentation darüber finden, was load_dataset speziell macht. Ich habe versucht, meine eigene csv zu erstellen und diese zu laden, aber ohne Erfolg. Ich benannte auch die Spitzen-Datei und es funktionierte noch ...

Meine Frage ist also:

Wo ist load_dataset eigentlich für Dateien suchen? Kann ich das auch für meine eigenen Boxplots verwenden?

EDIT: Ich habe es geschafft, meine eigenen Boxplots arbeiten mit meiner eigenen DataFrame, aber ich frage mich immer noch, ob load_dataset für etwas mehr als mysteriöse Tutorial-Beispiele verwendet wird.

+2

'load_dataset' ist nur eine Komfortfunktion für die Seaborn-Dokumentation. – mwaskom

Antwort

36

load_dataset sucht online csv-Dateien auf https://github.com/mwaskom/seaborn-data. Hier ist der Docstring:

Laden Sie einen Datensatz aus dem Online-Repository (erfordert Internet).

Parameter


Name: str Namen des Datensatzes (name .csv auf https://github.com/mwaskom/seaborn-data). Sie können mit Hilfe Liste der verfügbaren Datensätze erhalten: func: get_dataset_names

KWS: dict, optional Bestanden

pandas.read_csv Wenn Sie diese Online-Datensatzes ändern möchten oder in Ihren eigenen Daten zu bringen, Sie Wahrscheinlich muss pandas verwendet werden. load_dataset gibt tatsächlich ein Pandas DataFrame Objekt zurück, das Sie mit type(tips) bestätigen können.

Wenn Sie bereits erstellt Ihre eigenen Daten in eine CSV-Datei mit dem Namen, sagen wir, tips2.csv und speicherte es in der gleichen Position wie das Skript, verwenden Sie diese (nach Pandas Installation) laden es in:

import pandas as pd 

tips2 = pd.read_csv('tips2.csv')