Ich habe ein Problem "Optimierung" und ich weiß nicht wirklich, welchen Weg ich starten sollte. Hier ist die Beschreibung meines Problems:
Ich habe ein Korpus mit vielen Textsätzen. Jetzt muss ich ein Minimum an Sätzen aufnehmen (als Audiodateien), aber gleichzeitig die Anzahl der Sätze im Originalkorpus maximieren, die aus den aufgezeichneten Sätzen gebildet wurden - genauer gesagt von den aufgezeichneten Wörtern.
Ein sehr kurzes Beispiel dafür, was ich tun muss:
Corpus:
- schwarzer Hund
- graue Katze
- großen Hund
- graue Maus
- groß Maus
Beispiel für Mindeststrafen das Maximum des ursprünglichen Korpus zu decken:
- schwarzer Hund
- große Maus
- graue Katze
Von 3 Sätze (und ihre Worte) oben können wir die restlichen Sätze im Korpus bilden. Natürlich suche ich nach einer Berechnungsmethode, die optimal ist, weil mein Korpus Tausende von Sätzen enthält. Kennen Sie eine Methode, die für dieses Problem geeignet ist?
Vielen Dank für Ihre Antworten!
Morphid
Scheint, dass Sie hier einen zusätzlichen Parameter benötigen, um anzugeben, wie viel Sie in der Lage sind, ein zusätzliches Wort in Ihrer Minimalliste zu tauschen, um mehr Wörter im Korpus abzudecken. Für z.B. warum nicht "schwarze Hundemaus"? – samgak
Klingt wie das Set-Cover-Problem: https: //en.wikipedia.org/wiki/Set_cover_problem – m69
Danke für deine Antworten :-) @samgak Ich muss genaue Sätze aus meinem Korpus aufzeichnen, weil ich ihr Format behalten muss (wegen des zukünftigen Experiments, um nicht "Sätze" zu generieren, um das Ganze zu erfassen) Korpus) – Morphid