ich einige Probleme habe die gegenseitige Information Funktion implementieren, die Pythons maschinelles Lernen Bibliotheken, insbesondere: sklearn.metrics.mutual_info_score (labels_true, labels_pred, Kontingenz = None)Python-Implementierung von gegenseitiger Information
(http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html)
ich versuche, das Beispiel, das ich in der Stanford NLP Tutorial-Website finden umzusetzen:
Die Seite befindet sich hier: http://nlp.stanford.edu/IR-book/html/htmledition/mutual-information-1.html#mifeatsel2
Das Problem ist, dass ich verschiedene Ergebnisse erziele, ohne den Grund dafür herauszufinden.
Ich bekomme das Konzept der gegenseitigen Informationen und Feature-Auswahl, ich verstehe einfach nicht, wie es in Python implementiert ist. Was ich tue, ist, dass ich die wechselseitige_info_score-Methode mit zwei Arrays basierend auf dem NLP-Site-Beispiel zur Verfügung stelle, aber es gibt unterschiedliche Ergebnisse aus. Die andere interessante Tatsache ist, dass Sie sowieso herumspielen und Zahlen auf diesen Arrays ändern, die Sie am wahrscheinlichsten das gleiche Ergebnis erhalten werden. Soll ich eine andere Python-spezifische Datenstruktur verwenden oder was ist das Problem? Wenn jemand diese Funktion in der Vergangenheit erfolgreich genutzt hat, wäre es eine große Hilfe für mich, danke für Ihre Zeit.
Sie uns mit Arbeits Beispiel dafür, was „falsch“ ist genau das bieten sollte. – lejlot