Ich habe ein Ähnlichkeitsproblem hier. Ich möchte den Verkehr einer neuen Regel anhand von historischen Daten vorhersagen (Der Verkehr von Regeln, die in der Vergangenheit implementiert wurden). Traffic bedeutet hier, wie oft eine Regel einer Person entspricht. Hier ist ein Beispiel für eine Regel:Wie berechne ich die Ähnlichkeit zwischen logischen Regeln
Person.Age<20 and
(Person.number_of_children==3 or Person.married==True) and
Person.Work==student and
Person.Car.isSportCar==False and
Person.Car.Color in [blue,pink,red]
Wie Sie sehen können, in der Regel gibt es eine Menge von Attributen mit Booleschen Ausdrücken verknüpft. Die Regel passt zu einer Person, wenn sie und ihr Fahrzeug einige Kriterien erfüllen. Um den Verkehr einer Regel vorherzusagen, muss ich einen Abstand oder eine Ähnlichkeitsmetrik zwischen meinen Regeln finden, aber es fällt mir schwer, die Regeln in einem Spaltenausdruck zu reduzieren. Wenn ich es tun werde ich Informationen verlieren und hier ist der Grund: Ein Beispiel für Spalte Präsentation meiner Regel:
Person.Age : 20
Person.number_of_children:3
Person.married:True
Person.work:student
Person.Car.isSportCar:False
Person.Car.Color:[blue,pink,red]
Damit ich die ‚OR‘ und ‚<‘ und ‚in‘
verlierenVerflacht meine Regeln Ausdruck eine gute Idee oder gibt es eine andere? Sollte ich meine Regeln in eine andere Datenstruktur (z. B. eine Baumdatenstruktur) konvertieren, um den Ähnlichkeitswert zwischen ihnen besser abzufangen? Hast du ein paar Vorschläge?
Da Ihr Problem über Theorie ist, sollten Sie es auf https: // Statistiken veröffentlichen.stackexchange.com/ – pltrdy
Ich stimme ab, diese Frage als Off-Topic zu schließen, da übergeordnete Statistikfragen zu [Cross Validated] gehören (https://stats.stackexchange.com/) – Prune
Tut mir leid, dass ich das nicht getan habe Ich weiß, dass es eine andere Plattform auf dem Stapel gibt, auf der ich Statistikfragen posten kann. –