Allgemein gilt:
Bleu Maßnahmen Präzision: wie viel die Worte (und/oder n-Gramm) in der Maschine erzeugten Zusammenfassungen in den menschlichen Referenz Zusammenfassungen erschienen.
Rouge Maßnahmen Rückruf: wie viel die Wörter (und/oder N-Gramm) in den menschlichen Referenzzusammenfassungen in den maschinengenerierten Zusammenfassungen erschienen.
Natürlich - diese Ergebnisse ergänzen sich, wie es oft bei Präzision vs Rückruf der Fall ist. Wenn Sie viele Wörter/Ngramme von den Systemergebnissen haben, die in den menschlichen Referenzen erscheinen, haben Sie hohe Bleu, und wenn Sie viele Wörter/Ngrams von den menschlichen Bezügen haben, die in den Systemergebnissen erscheinen, werden Sie hohes Rouge haben.
Es gibt etwas namens Kürze Penalty, die ziemlich wichtig ist und bereits Standard-Bleu-Implementierungen hinzugefügt wurde. Es bestraft Systemergebnisse, die kürzer sind als die allgemeine Länge einer Referenz (lesen Sie mehr darüber here). Dies ergänzt das n-grammetrische Verhalten, das in der Tat länger bestraft wird als Referenzresultate, da der Nenner wächst, je länger das Systemergebnis ist.
Sie könnten auch etwas Ähnliches für Rouge implementieren, aber dieses Mal bestrafen Sie Systemergebnisse, die länger sind als die allgemeine Referenzlänge, die es sonst ermöglichen würden, künstlich höhere Rouge-Werte zu erhalten (je länger das Ergebnis, desto höher die Chance) Sie würden ein Wort treffen, das in den Referenzen erscheint). In Rouge teilen wir durch die Länge der menschlichen Referenzen, so dass wir eine zusätzliche Strafe für längere Systemergebnisse benötigen, die ihren Rouge-Score künstlich erhöhen könnten.
Schließlich konnte man die F1 Maßnahme verwenden, um die Metriken zu machen arbeiten zusammen: F1 = 2 * (Bleu * Rouge)/(Bleu + Rouge)
Vielen Dank für Ihre Sharing. Sie haben erwähnt, dass die Zusammenfassungsaufgabe 2008 in die Text Retrieval Conference (TREC) verlegt wurde. Der von Ihnen angegebene Link verweist jedoch auf TAC (Text Analysis Conference). Unter http://trec.nist.gov/data.html konnte ich keine Zusammenfassungsaufgaben finden (außer einer temporären Zusammenfassungsaufgabe). –
Danke, ich habe es behoben. –