Wie würde ich Extract Restdaten für ein bestimmtes Baseball-Team im folgenden linearen Modell extrahieren? Zum Beispiel, wie würde ich die Residuen für "CLE" extrahieren?So extrahieren Sie spezifische Restdaten aus einem linearen Modell in R
library(Lahman)
library(dplyr)
library(broom)
# create baseball team data
data(Teams)
teams <- Teams
teams <- teams %>% mutate(win_percentage = (W/(W + L)) * 100)
# summarize baseball team salary by year
salaries <- Salaries
salaries <- salaries %>%
group_by(teamID, yearID, lgID) %>%
summarise(payroll_M = sum(as.numeric(salary))/10^6) %>%
ungroup()
# add winning percentage to the salary table
salaries <- teams %>%
select(yearID, teamID, win_percentage) %>%
right_join(salaries, by = c("yearID", "teamID"))
# compute linear model of winning vs team salary
model <- salaries %>%
group_by(yearID) %>%
do(fit = augment(lm(win_percentage ~ payroll_M, data = .)))
# extract residuals for Cleveland ??????
David, vielen Dank! Ich habe die Hilfe für augment.lm gelesen, aber es war mir nicht klar, dass der zweite Parameter das war, was ich brauchte. Ich lerne immer noch, wie man das Hilfesystem liest und versteht. – user3457456
David, ich habe eine Nachfolge für dich. Die Hilfe für den Parameter "data" lautet "Originaldaten, standardmäßig wird das Modell aus dem Modell extrahiert". Werden alle Daten, die in den Abrechnungsdatenrahmen aufgenommen wurden, im lm-Befehl in das lineare Modell geschrieben und werden sie nur aus dem linearen Modell extrahiert? Verstehe ich das richtig? – user3457456
@ user3457456 Standardmäßig sind die im Modell gespeicherten Daten nur die Spalten, die direkt im Modell verwendet wurden (versuchen Sie 'model.frame (fit)' auf einem linearen Fit-Objekt und Sie werden es sehen). So haben sich die Variablen win_percentage und salary ursprünglich gehalten. Der Vorteil von 'data = .' besteht darin, dass alle ursprünglichen Daten erweitert werden. –