Als Antwort auf @ j.jerrod.taylor Antwort, lassen Sie mich meine Frage neu formulieren, um Missverständnisse zu beseitigen.Glatte Werte mit Bin-Grenzen: Wo setzen Sie einen Wert, der genau zwischen der unteren und oberen Grenze liegt?
Ich bin neu im Data Mining und lerne, wie man mit verrauschten Daten umgeht, indem ich meine Daten mit der Methode "Gleichbreite/Entfernung" über "Bin Boundaries" glätten. Nehmen Sie den Datensatz 1,2,2,3,5,6,6,7,7,8,9 an. Ich möchte auszuführen:
- Abstand Binning mit 3 Behältern und
- Glatte Werte von Bin Grenzen basierend auf Werten in # binned 1.
Basierend auf Definition in (Han, Kamber, Pei, 2012, Data Mining-Konzepte und Techniken, Abschnitt 3.2.2 verrauschten Daten):
In Glättung durch bin Grenzen, das Minimum und Maximalwerte in einem gegebenen Bin werden als die Bin-Grenzen identifiziert. Jeder Bin-Wert wird dann durch den nächsten Randwert ersetzt.
- Intervallbreite = (max-min)/k = (9-1)/3 = 2,7
Bin Intervalle = [1,3.7), [3.7,6.4), [6,4, 9.1]
Original Bin1: 1,2,2,3 | Fachgrenzen: (1,3) | Glatte Werte von Bin Grenzen: 1,1,1,3
- Original Bin2: 5,6,6 | Fachgrenzen: (5,6) | Glatte Werte von Bin Grenzen: 5,6,6
- Original Bin3: 7,7,8,9 | Fachgrenzen: (7,9) | Glatte Werte von Bin Grenzen: 7,7, , 9
Frage: - wo kommt gehören in Bin3 wenn Bin Grenzen Methode binned verwenden, da es 1 von 7 und -1 ab 9?
Sie mißverstanden meine Frage auf „Glättungswerten von Bin Grenzen“ und „Grenzen sind ". Ich habe meine Frage so umformuliert, dass sie alle Details enthält, die zu meiner Frage führen. – user2771721
@ user2771721 Ich habe nichts falsch verstanden. Siehe meine Bearbeitung. –