2016-10-08 5 views
2

Eine andere Möglichkeit, dies zu fragen, ist: Können wir relative Rankings aus separaten Datensätzen verwenden, um einen globalen Rang zu erzeugen?Können wir Rankings von etwas ähnlichen Datensätzen zusammenführen, um einen globalen Rang zu erzeugen?

Angenommen, ich habe eine Vielzahl von Datensätzen mit eigenen Rankings nach den Kriterien Niedlichkeit für Jungtiere: 1) Kätzchen, 2) Welpen, 3) Faultiere und 4) Elefanten. Ich verwendete paarweise Vergleiche (d. H. Zeige den Leuten zwei zufällige Bilder des Tieres und bat sie, die süßeste auszuwählen), um diese Ranglisten zu erhalten. Ich habe auch die volle Anzahl von Vergleichen innerhalb von Datensätzen (d. H. Alle Welpen wurden im Welpendatensatz miteinander verglichen).

Ich versuche jetzt, die Datensätze zusammenzuführen, um eine globale Rangliste des süßesten Tieres zu erzeugen.

Das Hauptproblem der relativen Rangordnung ist, dass das süßeste Tier in einem Set nicht unbedingt das süßeste in dem anderen Set sein muss. Nehmen wir zum Beispiel an, dass Elefantenbabys weniger attraktiv sind, und so wird das niedlichste Kätzchen immer den süßesten Elefanten schlagen. Wie soll ich dieses Problem umgehen?

Ich denke daran, ein paar Kreuz Vergleiche über Datensätze (Kätzchen vs Elefanten, Welpen vs Kätzchen, etc) eine Art von grundlegender Bedeutung zu erstellen, aber dies kann problematisch werden, wie ich die Anzahl der Tiere und die hinzufügen Art der Tiere.

Ich habe auch darüber nachgedacht, weiter in dünn besetzte Matrizen zu suchen, aber ich denke, dass dies nur für einen Datensatz gilt und nicht für den Vergleich mit mehreren Datensätzen?

Antwort

1

Sie können Ihre Aufgabe mit einem Rating-System, wie die meisten bekannten Elo erreichen, Glicko oder unsere rankade. Ein Rating-System ermöglicht ein Ranking ausgehend von paarweise Vergleiche zu bauen, und

  • Sie brauchen nicht alle Vergleiche zu tun, weder haben alle Tiere in der gleichen Anzahl von Vergleichen beteiligt sein,
  • Sie dies nicht tun Sie müssen einen Vergleich nur innerhalb eines bestimmten Datensatzes durchführen (lassen Sie alle Tiere gegen alle anderen Tiere "spielen", wenn Sie für einen Datensatz ein Ranking benötigen, verwenden Sie einfach die globale Rangfolge und ignorieren Sie Tiere von anderen Tieren).

Mit rankade (hier ist ein comparison mit oben genannten Ranking-Systeme und Trueskill Microsoft) Sie auch Ausgaben für 2+ Elemente aufnehmen können, während mit Elo oder Glicko Sie dies nicht tun. Es ist extrem unordentlich und schwierig für Leute, viele Gegenstände zu ordnen, aber ein kleiner multipler Vergleich (z.B. 3-5 Tiere) sollte in Ihrer Arbeit geeignet und nützlich sein.

+1

Danke für den Vorschlag, und coole Website! (Ich könnte das das nächste Mal überprüfen, wenn meine Freunde und ich ein Turnier spielen.) Ich könnte einfach von Anfang an ein globales Ranking machen, und dann, um eine lokale Rangliste zu erhalten, einfach die anderen Tiere eliminieren. Ein mögliches Problem ist jedoch die Skalierung - wie Sie bereits erwähnt haben, wäre dies für 3-5 Tiere in Ordnung, aber ich plane, Hunderte von Tieren hinzuzufügen. –

+1

Nur eine Anmerkung: Ich schlug 3-5 (oder sogar mehr) Tiere für ** jeden Vergleich vor ** (dh * match *), einen mehrteiligen Vergleich anstelle von "klassischen" Zwei-Items-Vergleich, aber es gibt keinen solchen Grenze für die Anzahl der Tiere in einer Gruppe. –

+0

Oh, ich verstehe. Danke für die Abklärung. Es wäre also ein dreifacher oder fünffacher Vergleich. Ich nehme an, diese Methode würde nicht sehr gut mit Bindungen umgehen, aber es wäre eine gute Methode zur Skalierung. –

Verwandte Themen