2016-05-12 14 views
0

Ich habe einen Datenrahmen whos Struktur ist wie folgt:Fehler Plotten Datenrahmen - ggplot

'data.frame': 78420 obs. of 12 variables: 
$ MATNR   : Factor w/ 354 levels "16I","16W","18P",..: 42 62 21 23 213 100 23 103 42 213 ... 
$ DERIV_DESC : Factor w/ 277 levels "86 2.0 High AT",..: 150 174 138 144 112 192 144 195 150 112 ... 
$ SELL_DATE  : Date, format: "2015-02-11" "2015-01-06" "2015-02-09" "2015-01-02" ... 
$ OWNER_EMAIL : chr "[email protected]" "" "[email protected]" "[email protected]" ... 
$ CELL_NUM  : chr "0825654797" "0828256975" "0829575014" "0825507622" ... 
$ GENDER  : chr "Male" "Male" "Male" "Male" ... 
$ DATE_OF_BIRTH : Date, format: "1950-05-22" NA "1949-06-25" "1957-06-01" ... 
$ SERVICE_DATE : Date, format: "2016-03-23" "2015-11-02" NA NA ... 
$ SELL_DLR  : int 12095 45070 63436 26400 63886 11500 26495 11054 23318 13048 ... 
$ RANGE   : Factor w/ 26 levels "86","Auris","Avanza",..: NA NA 18 NA 11 NA NA NA NA 11 ... 
$ TESTDRIVE_DATE: Date, format: NA NA NA NA ... 
$ Age   : int 66 NA 66 58 29 65 52 63 56 56 ... 

ich plotten versuche, dass Daten ggplot2 wie folgt verwendet wird.

new_Data %>% group_by(GENDER,SELL_DATE) %>% 
summarize(n=length(GENDER)) %>% 
ggplot(mapping=aes(x=SELL_DATE, y=n, col=GENDER , size=n)) + 
    geom_point() + 
ggtitle("Sales Figures per Gender") + 
labs(x="Date",y="Sales") 

Ich erhalte den folgenden Fehler.

Fehler bei eval (ausdr, envir, enclos): Objekt 'SELL_DATE' nicht

gefunden

Ich hatte dies vor der Arbeit, aber wenn ich die Größe des Datensatzes erhöht Arbeits es stoped.

+1

verwenden Sie bitte 'dput()', Ausgabe von 'str()' kann nicht verwendet werden um Ihren Code zu reproduzieren – mtoto

+0

HI Dort sind die Daten vertraulich, so kann der ganze Datensatz nicht ausgegeben werden. –

+0

Es gibt 471 Unique sell date entries gibt es eine Grenze, die Sie verwenden können, um plotten –

Antwort

0

ich reproduzierte Daten und es funktioniert absolut gut für mich:

new_Data = data_frame(
    GENDER = sample(c("Male", "Female"), 1000, replace = TRUE), 
    SELL_DATE = sample(seq(as.Date('2016-01-01'), Sys.Date(), 1), 1000, replace = TRUE) 
) 

new_Data %>% 
    group_by(GENDER, SELL_DATE) %>% 
    summarize(n = length(GENDER)) %>% 
    ggplot(aes(x = SELL_DATE, y = n, col = GENDER , size = n)) + 
    geom_point() + 
    ggtitle("Sales Figures per Gender") + 
    labs(x = "Date",y = "Sales") 

Es könnte ein Problem mit dem Datenrahmen sein, die Benennung der Variablen in particualr. Es ist schwierig, Ihnen weiter zu helfen, wenn Sie Ihre Frage nicht mit einer besser reproduzierbaren Version des Problems aktualisieren und Ihre Daten

+0

Ich fand heraus, dass ich auch die plyr-Bibliothek geladen hatte, die meiner Meinung nach meine dplyr-Bibliothek vermasselt hatte. Danke für die Hilfe! –

Verwandte Themen