2016-07-14 13 views
0

Ich bin neu in der Programmierung und ich habe die vorherigen Antworten auf diese Frage angesehen, aber keine scheint für diese spezifische Abfrage relevant.Variable nicht definiert während der Datenanalyse

Ich lerne Daten mit Python zu analysieren.

Dies ist der Code:

import pandas as pd 

import os 

os.chdir('/Users/Benjy/Documents/Python/Data Analysis Python') 

unames = ['user_id', 'gender', 'age', 'occupation', 'zip'] 
users = pd.read_table('ml-1m/users.dat', sep='::', header = None, names = unames) 

rnames = ['user_id', 'movie_id', 'rating', 'timestamp'] 
ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header = None, names = rnames) 

mnames = ['movie_id', 'title', 'genres'] 
movies = pd.read_table('ml-1m/movies.dat', sep='::', header = None, names = mnames) 

data = pd.merge(pd.merge(ratings, users), movies) 


mean_ratings=data.pivot_table('ratings',rows='title', cols='gender',aggfunc='mean') 

ich immer einen Fehler bekommen mean_ratings sagen, ist nicht definiert ... aber sicher ist es in der letzten Zeile des Codes oben definiert?

+0

Sie vorbei 'ratings' als String auf der' pivot_table() 'Funktion in dem eine Tabelle erwartet wird. Entfernen Sie die Anführungszeichen und versuchen Sie es erneut. Wie so: 'mean_ratings = data.pivot_table (Bewertungen, Zeilen = 'title', cols = 'Geschlecht', aggfunc = 'gemein')' –

+0

Versucht, dass - immer noch der gleiche Fehler! – HereItIs

+1

Können Sie die vollständige Fehlernachricht, die Sie erhalten, angeben? – DavidG

Antwort

1

ich denke, das funktioniert: mean_ratings=data.pivot_table('rating',index='title',columns='gender',aggfunc='‌​mean')

Verwandte Themen