Ich bin auf der Suche nach einem Algorithmus (vorzugsweise mit einer Bibliothek in C++) oder eine Idee, um mir zu sagen, ob bestimmte Zahlen in einem Intervall gleichmäßig verteilt sind oder nicht. Stellen Sie sich vor, ich habe zwei Strings: der erste ist fehlerfrei und der zweite hat an einigen Stellen einige Fehler. Ich möchte überprüfen, ob die Position von Fehlern in der Zeichenfolge statistisch sinnvoll ist oder nicht.Wie testen, ob einige Zahlen gleichmäßig in einem Intervall verteilt sind?
betrachten Sie das folgende Beispiel. Im ersten Fall sind die Fehler gleichmäßig verteilt und im zweiten Fall sind sie alle am Ende des Strings, was mein Algorithmus einige Alarme darüber geben sollte.
error-free string: 0110110101010110101 (3 errors occur at pos:5,12,15)
erroneous string : 0110010101000100101
sedond Beispiel:
error-free string: 0110110101010110101 (3 errors occur at pos:17,18,19)
erroneous string : 0110110101010110010
kann ich sagen, die Fehler in den ersten Daten sind normal, aber nicht in dem zweiten.
Bisher bin ich zu dieser Idee gekommen: Ich möchte die Zeichenfolge in gleiche Bins aufteilen, nehme an, dass die Zeichenfolge Länge 100 ist. Ich wähle 10 bin Größe 10. Dann schaue ich auf die Gesamtzahl der Fehler in der String, von dem wir annehmen können, dass er 10 ist. Ich erwarte einen Fehler in jedem Fach. Jetzt berechne ich, wie weit meine Beobachtung statistisch von meiner Erwartung entfernt ist. Hat jemand eine Idee, ob diese Methode korrekt ist oder nicht? Und wenn es funktioniert, wie groß sollte jeder Behälter sein. Kommt es auf die Anzahl der Fehler an?
Siehe http://math.stackexchange.com/questions/2435/is-there-a-simple-test-for-uniform-distributions – Bathsheba
Suchen Sie den Chi-Quadrat-Test. Denken Sie daran, dass statistische Tests aufgrund ihrer Natur falsch positive und falsch negative Ergebnisse haben können. – Peter
Wie wäre es mit einer Histogramm + Kleinste-Quadrate-Anpassung einer Konstante auf diesem Histogramm? Chi-Quadrat wird Ihnen sagen, wie gut Ihre Distribution ist, weil sie eine Konstante modelliert. –