Ich habe diese Funktion, um eine t-test durchzuführen, mit Stichproben und Populationen mit dem gleichen Schlüssel in Wörterbüchern. Es funktioniert gut, wie vorgesehen.Bootstrap t Methode Python-Implementierung
def ttest_(d):
result = {}
for k, (l, t) in d.items():
mean_sample = np.mean(t)
mean_population = np.mean(l)
sd_sample = np.std(t, ddof=1)
sd_population = np.std(l, ddof=1)
sample_size = len(t)
population_size = len(l)
result[k] = round(((mean_sample - mean_population)/
np.sqrt(((sd_sample/np.sqrt(sample_size))**2) +
((sd_population/np.sqrt(population_size))**2))), 2)
Wie kann ich diese Funktion modifizieren, um:
-> Statt einmal die endgültige Berechnung tun, tun Sie es in einer Bootstrap-x-mal entlang der Linien von so etwas wie:
for _ in range(1000)
-> Der vorherige Schritt, würde eine Verteilung von T-Tests pro Schlüssel erstellen, dann wäre das Ergebnis [k] der n-ten Perzentilwert .... den Sie mit einem Parameter angeben und einen Wert angeben könnten sage 0,05.
Edit # 1: Aus Gründen der Klarheit der Weg I die Funktion ist die folgende:
pairs = {}
for (k, v), (k2, v2) in product(population.items(), samples.items()):
if k == k2:
pairs.update({k: (v, v2)})
dann die Formel auf dieser dict angewendet:
ttest_ = ttest_(pairs)
Edit # 2 : ist wichtig, um diese Struktur der Anwendung der Funktion auf ein Wörterbuch von Wörterbüchern zu erhalten, um die Assoziationen zwischen den verschiedenen zu machen t Samples und Schlüssel, und erhalten das zugehörige Ergebnis [k]. Der einzige Unterschied besteht im Hinzufügen eines Bootstrap und der Perzentilauswahl.
Bearbeiten # 3: Dank Norman Frage. Um dies zu verdeutlichen, vergleichen Sie in der neuen Formel das gleiche Sample [k] mit einer zufälligen Sub-Stichprobe aus der Population [k], x-mal, so erhalten Sie die Verteilung. Diese Unterstichproben haben die Größe der ursprünglichen Stichprobe [k].
Ich konnte die 'Suche nach einer Antwort Zeichnung aus glaubwürdigen Quellen' nicht ändern ........ Ich will das nicht unbedingt. Nur eine gute vollständige gute Antwort. Danke – hernanavella
Wie "eine Verteilung von T-Tests pro Schlüssel erstellen"? Was würde der Bootstrap x mal machen? Sollte es zufällige Unterstichproben aus der Stichprobe ziehen und dann T-Werte für sie berechnen? – Norman
@Norman So ist das Beispiel immer gleich (pro Schlüssel), und es wird verglichen mit Sub-Stichproben, die aus der Population x-mal gezogen werden, so dass Sie x verschiedene t-Werte erhalten. – hernanavella