Ich versuche, mehrere einzelne Mapply-Anweisungen durch einen einzigen, komprimierten Code zu ersetzen. Ich habe es schließlich mit 3 verschachtelten Mapply-Anweisungen arbeiten lassen, aber das scheint ein bisschen kompliziert zu sein. Ich bin neu von R aus anderen Sprachen, also suche nach etwas Hilfe, um in der R-Mentalität zu denken. Wenn die 3 Aussagen der beste Ansatz ist, kann ich damit leben, aber auf der Suche nach Input. Wenn Sie eine bessere Methode zur Strukturierung von Teilmengen wie diese haben, bin ich ganz Ohr.Verschachtelte Mapply-Anweisungen vereinfachen
payments <- data.frame(
Amount = sample(5:15,100,replace=TRUE),
Tip.Amount = round(runif(100,0,2),2),
"A" = sample(c(TRUE,FALSE),100,replace=TRUE),
"B" = sample(c(TRUE,FALSE),100,replace=TRUE),
"C" = sample(c(TRUE,FALSE),100,replace=TRUE),
"D" = sample(c(TRUE,FALSE),100,replace=TRUE),
"E" = sample(c(TRUE,FALSE),100,replace=TRUE),
"F" = sample(c(TRUE,FALSE),100,replace=TRUE),
Date = sample(seq(as.Date("2016-01-01"),as.Date("2016-01-31"),by="day"),100,replace=TRUE)
)
employees <- c("A","B","C","D","E","F")
dots <- lapply(c(employees,"Date"),as.symbol)
payments.by_date_employee <- payments %>%
filter(!is.na(Date),!is.na(Amount)) %>%
group_by_(.dots=dots) %>%
summarise(Payment.Count=n(), Amount=sum(Amount),
Tip.Count=sum(Tip.Amount>=0.01,na.rm=TRUE), Tip.Amount=sum(Tip.Amount,na.rm=TRUE)) %>%
ungroup() %>%
arrange(Date)
#long/manual way--------------------------------------------------------------------------------
t <- list()
t[["payments"]][["amount"]] <- mapply(function(name) list({
t.test(subset(payments,payments[[name]]==TRUE)$Amount,
subset(payments,payments[[name]]==FALSE)$Amount)$p.value
}),
employees)
t[["payments"]][["count"]] <- mapply(function(name) list({
t.test(subset(payments.by_date_employee,payments.by_date_employee[[name]]==TRUE)$Amount,
subset(payments.by_date_employee,payments.by_date_employee[[name]]==FALSE)$Amount)$p.value
}),
employees)
t[["tips"]][["amount"]] <- mapply(function(name) list({
t.test(subset(payments,payments[[name]]==TRUE)$Tip.Amount,
subset(payments,payments[[name]]==FALSE)$Tip.Amount)$p.value
}),
employees)
t[["tips"]][["count"]] <- mapply(function(name) list({
t.test(subset(payments.by_date_employee,payments.by_date_employee[[name]]==TRUE)$Tip.Amount,
subset(payments.by_date_employee,payments.by_date_employee[[name]]==FALSE)$Tip.Amount)$p.value
}),
employees)
#long/manual way--------------------------------------------------------------------------------
#attempt at single mapply statement ------------------------------------------------------------
y <- mapply(function(name,type,variable,df,nm) list({
t.test(subset(eval(df),eval(df)[[name]]==TRUE)[[nm]],
subset(eval(df),eval(df)[[name]]==FALSE)[[nm]])$p.value}),
employees,
c("payments","payments","tips","tips"),
c("amount","count"),
c(quote(payments),quote(payments),quote(payments.by_date_employee),quote(payments.by_date_employee)),
c("Amount","Amount","Tip.Amount","Tip.Amount"),
SIMPLIFY = FALSE
)
#attempt at single mapply statement ------------------------------------------------------------
#works but seems convoluted --------------------------------------------------------------------
z <- mapply(function(type) list({
mapply(function(variable,df,nm) list({
t[[type]][[variable]] <-mapply(function(name) list({
t.test(subset(eval(df),eval(df)[[name]]==TRUE)[[nm]],
subset(eval(df),eval(df)[[name]]==FALSE)[[nm]])$p.value}),
employees)
}),
c("amount","count"),
c(quote(payments),quote(payments),quote(payments.by_date_employee),quote(payments.by_date_employee)),
c("Amount","Amount","Tip.Amount","Tip.Amount"),
SIMPLIFY = FALSE
)
}),
c("payments","tips")
)
#works but seems convoluted --------------------------------------------------------------------
Auf jeden Fall sehen, dass es funktioniert. Versuchen, einen Sinn zu machen, was Sie getan haben, bevor Sie es als korrekt markiert haben. Du machst einige Dinge, die neu für mich sind! – atclaus
Wie empfehlen Sie, zusätzliche Werte aus dem t-test herauszuziehen? Ich suche nach dem x und y mean, damit ich zusammenfassen kann, in welche Richtung der Unterschied besteht ... – atclaus
Siehe Änderungen. –