2016-11-19 3 views
1

Ich bin mir nicht sicher, welche dieser 2 Möglichkeiten, wenn überhaupt, ist die richtige Art der Strukturierung der Klammern für zufällige Wirkung in 2x2 LMM. Meine IVs sind source und cnd und das DV ist firstfix.2x2 lineare Mixed-Effekte-Modell

one <- lmer(firstfix ~ source + cnd + source:cnd + 
    (1 + source + cnd | object) + (1 + cnd | subj) + 
    (1 + source:cnd | object), together, REML = FALSE) 

two <- lmer(firstfix ~ source + cnd + source:cnd + 
    (1 + cnd | object) + (1 + source | object) + 
    (1 + cnd | subj) + (1 | subj) + (1 + source:cnd | object), 
     together, REML = FALSE) 

Antwort

4

tl; dr Sie mit ziemlicher Sicherheit das Modell zu vereinfachen, müssen ...

Der wesentliche Unterschied besteht darin, dass lme4 behandelt Zufallseffekte Begriffe (dh Begriffe geschrieben in getrennten klammerten chunks) als unabhängige trennen . Nehmen wir zur Veranschaulichung an, dass source und cnd beide kategorische (Faktoren) sind, und dass source 2 Ebenen und cnd 3 Ebenen hat.

(1 + source + cnd | object) + (1 + cnd | subj) + (1 + source:cnd | object) 

Dies wird mit 3 Blöcken zu einem block-diagonal Varianz-Kovarianzmatrix geben: die ersten (1 + (2-1) + (3-1)) = 4 Reihen/Spalten aufweist, wobei die zweiten hat (1+ (3-1)) = 3 Zeilen/Spalten, und die letzte hat 6 Zeilen/Spalten. Es wird insgesamt (4 * 5/2 + 3 * 4/2 + 6 * 7/2) = 37 Varianz-Kovarianz-Parameter geben, die extrem ist unwahrscheinlich, aus nur einem riesigen Datensatz identifiziert werden. Darüber hinaus werden der erste und der dritte Term definitiv verwechselt, weil die rohe Interaktionskomponente im dritten Term sich zu Termen ausweiten wird, die gleichbedeutend sind mit den Haupteffekten im ersten Semester. Die Abfangterme werden auch zwischen den beiden Gruppentermen (erster und dritter) verwechselt.

(1 + cnd | object) + (1 + source | object) + 
(1 + cnd | subj) + (1 | subj) + (1 + source:cnd | object), 

Dies setzt die Begriffe alle unabhängig sind, so haben wir Blockgrößen von (3,2,3,1,6), oder (6 + 3 + 6 + 1 + 21) = (wieder) 37 var-cov-Parameter. Die Intercept-Terme werden zwischen den Termen mit derselben Gruppierungsvariablen verwechselt.

Beide Modelle (1) enthalten redundante Terme und (2) sind überparametriert. Wenn Sie wirklich Barr et al die "keep it maximal" Rat folgen wollen, verwenden Sie dann

(source*cnd|object) + (cnd|subj) 

(der erste Term auf (1+source+cnd+source:cnd|object) entspricht), die Sie Blöcke (6,3) oder 27 Parameter geben.

Hier gibt es noch viel mehr zu sagen: schauen Sie sich z. bei den Erwiderungen von Vashishth und Bates zu Barr et al. und dem Projekt RePsychLing.

+0

Ist das mit der "Gegenerklärung" gemeint? https://arxiv.org/abs/1506.04967 –

+0

ja: eine von drei Referenzen in der README hier aufgelistet: https://github.com/dmbates/RePsychLing –