ich bei der Durchführung t.tests für mehrere Kategorien in Rstudio steckte. Ich möchte die Ergebnisse des t.test jedes Produkttyps haben und die Online- und Offline-Preise vergleichen. Ich habe über 800 Produkttypen, weshalb ich es nicht für jede Produktgruppe manuell machen möchte.Führen Sie mehrere gepaarten t-Tests basierend auf Gruppen/Kategorien
Ich habe einen Datenrahmen (mehr als 2 Millionen Zeilen) Daten genannt, die wie folgt aussieht:
> Product_type Price_Online Price_Offline
1 A 48 37
2 B 29 22
3 B 32 40
4 A 38 36
5 C 32 27
6 C 31 35
7 C 28 24
8 A 47 42
9 C 40 36
Ideal genannt product_types das Ergebnis der t.test auf einen anderen Datenrahmen schreiben Ich möchte R:
> Product_type
1 A
2 B
3 C
4 D
5 E
6 F
7 G
8 H
9 I
800 ...
wird:
> Product_type t df p-value interval mean of difference
1 A
2 B
3 C
4 D
5 E
6 F
7 G
8 H
9 I
800 ...
Dies ist die Formel, wenn ich alle Produkttypen in diff hatte eren Datenrahmen:
t.test(Product_A$Price_Online, Product_A$Price_Offline, mu=0, alt="two.sided", paired = TRUE, conf.level = 0.99)
Es muss einen einfacheren Weg geben, dies zu tun. Ansonsten muss ich 800+ Datenframes machen und dann den t-Test 800 mal durchführen.
Ich habe versucht, die Dinge mit Listen & lapply aber bisher funktioniert es nicht. Ich habe auch t-Test auf mehrere Spalten: https://sebastiansauer.github.io/multiple-t-tests-with-dplyr/
Aber am Ende ist er immer noch manuell einfügen männlich & weiblich (für mich über 800 Kategorien).
[Dies wird es tun] (http://stats.stackexchange.com/questions/168378/applying-two-sample-t-test-comparing-multiple-groups-in-two-categories) – Sotos