Ich arbeite Benutzerverhalten Projekt. Basierend auf Benutzerinteraktion habe ich einige Daten. Es gibt eine schöne Sequenz, die mit der Zeit gleichmäßig zunimmt und abnimmt. Aber es gibt kleine Diskrepanzen, die sehr schlecht sind. Siehe unten grafisch darzustellen:Wie normalisiert man die Reihenfolge der Zahlen?
2,0789 2,09604 2,11472 2,13414 2,15609 2,17776 2,2021 2,22722 2,25019 2,27304 2,29724 2,31991 2,34285 2,36569 2,38682 2,40634 2,42068 2,43947 2,45099 2,46564 2,48385 2,49747 2,49031 2,51458:
Sie auch Daten finden Sie hier 2,5149 2,52632 2,54689 2,56077 2,57821 2,57877 2,59104 2,57625 2,55987 2,5694 2,56244 2,56599 2,54696 2,52479 2,50345 2,48306 2,50934 2,4512 2,43586 2,40664 2,38721 2,3816 2,36415 2,33408 2,31225 2,28801 2,26583 2,24054 2,2135 2,19678 2,16366 2,13945 2,11102 2,08389 2,05533 2,02899 2,00373 1,9752 1,94862 1,91982 1,89125 1,86307 1,83539 1,80641 1,77946 1 .75333 1,72765 1,70417 1,68106 1,65971 1,64032 1,62386 1,6034 1,5829 1,56022 1,54167 1,53141 1,52329 1,51128 1,52125 1,51127 1,50753 1,51494 1,51777 1,55563 1,56948 1,57866 1,60095 1,61939 1,64399 1,67643 1,70784 1,74259 1,7815 1,81939 1,84942 1,87731 1,89895 1,91676 1,92987
Ich mag diese Sequenz glätten. Die Technik sollte in der Lage sein, Zahlen mit der Charakteristik von X und Y zu eliminieren, d. H. Fehler bei der Mono-Erhöhung oder Mono-Verringerung.
Wenn nicht eliminieren, sollte die Technik in der Lage sein, sie so zu verschieben, dass die Serie nicht von Fehlern betroffen ist.
Was habe ich versucht und sind gescheitert:
Ich versuchte Differenz zwischen den Werten zu testen. In einigen speziellen Fällen funktioniert es, aber für die Sequenz wie in diesem Fall der Abstand zwischen Zahlen ist nicht so, dass ich Fehler ausschneiden kann
Ich habe versucht, einen Zähler, der einige X ist, dann nur ändern wird akzeptiert, sonst Punkt wird nur dem vorherigen Punkt zugeordnet. Hier habe ich große Schwierigkeiten, den Wert von X zu bestimmen, weil dies auf Benutzerinteraktion basiert, ich bin nicht wirklich Controller davon. Wenn die Benutzerinteraktion so ist, dass ihr Diagramm ein Zickzack-Muster wäre, würde ich mit der Situation "keine Benutzerbewegungsdaten überhaupt erkannt" enden.
Bitte teilen Sie die Techniken, die Sie kennen.
PS: Die in diesem Beispiel zur Verfügung gestellten Daten sind ein spezieller Fall. Es gibt kein typisches Muster, in dem Zahlen auftreten werden, aber wir erwarten, dass einige Bereiche mit allen Beispielen übereinstimmen. Die Lösung, nach der ich suche, ist generisch.
Was wäre/könnte falsch mit einer naiven Glättung über eine Handvoll Werte sein? – JBL
Ich nehme an, du meinst Tiefpassfilterung oder laufende Mittelwertmethode. Bei der Tiefpassfilterung kann ich mich nicht über die Frequenz entscheiden, so dass Fehler nicht mehr aussortiert werden können. Mit laufendem Mittelwert gehen X- und Y-Fehler weg, aber eingekreiste Bereiche beeinflussen den laufenden Mittelwert schlecht, so dass viele Fehler dort bleiben, wie sie sind. – Adorn
Was bedeutet der Begriff "normalisieren" im Titel? –