Zum Beispiel habe ich einen Text, der aus Zeilen besteht. Jede Zeile hat ihre eigene Länge, Einrückung und andere Merkmale. Mein Ziel ist es, Gedichte in diesem Text zu finden, aber alle Clustering-Methoden, die ich kenne, ordnen Zeilen um und erstellen Cluster unabhängig von der Position im Text. Ich habe versucht, die Position als eine der Funktionen zu verwenden, aber ich mag das Ergebnis nicht. Es wird cool sein, wenn du mir etwas wie DBSCAN anzeigst. Kannst du mir helfen?Gibt es Clustering-Methode, die Neuordnung verhindert?
0
A
Antwort
-1
Ich denke, diese Frage läuft darauf hinaus, welche Funktionen zu verwenden. Sie haben eine Aufgabe zur Verarbeitung natürlicher Sprache, so würde ich vorschlagen Word2Vec, z.B.
- https://www.tensorflow.org/versions/r0.9/tutorials/word2vec/index.html
- https://radimrehurek.com/gensim/models/word2vec.html
Dieser Ansatz ist in der Lage Wörter einzubetten, Sätze und sogar Dokumente in einem Vektorraum.
Siehe auch: Document classification with distributions of word vectors
1
Angeblich soll Clustering für Ihr Problem nicht das richtige Werkzeug ist. Es könnte ein Segmentierung Algorithmus geben, der zu Ihrem Problem adoptiert werden kann.
Aber besser betrachten Sie es als ein Optimierungsproblem, und lösen Sie es als solches, anstatt zu hoffen, dass einige Clustering-Algorithmus passiert zu arbeiten.
Verwandte Themen
- 1. Bootstrap Spalten vertikale Neuordnung
- 2. Statement-Neuordnung mit Sperren
- 3. Matrix-Neuordnung zur Blockdiagonalform
- 4. UITableViewController Neuordnung des kopierten Arrays?
- 5. Neuordnung für FFT in Python
- 6. Layer-Neuordnung beim schnellen Scrollen
- 7. Horizontale Neuordnung von UICollectionView-Zellen
- 8. Gibt es eine Konfigurationsoption in PHP, die verhindert, dass undefinierte Konstanten als Strings interpretiert werden?
- 9. Java-Speichermodell: Neuordnung und gleichzeitige Sperren
- 10. Inline-Neuordnung von Teilstrings über Bash
- 11. Neuordnung des Puffers und nicht geänderte Register
- 12. gibt es die Portlet-Position
- 13. Wie verhindert man die Änderung der Funktion?
- 14. Gibt es etwas, das verhindert, dass Response.Redirect im try-catch-Block funktioniert?
- 15. Wie verhindert Eigen die Generierung temporärer Objekte?
- 16. Warum die Neuordnung von Commits mit Git-Rebase -i nicht die Geschichte versauen?
- 17. Android verhindert die Wiederherstellung der Aktivität
- 18. Warum verhindert Visual Studio, dass ich die .csproj-Datei sehen kann, und gibt es eine Möglichkeit, sie zu erzwingen?
- 19. Gibt es etwas in der Android-Architektur oder API, das verhindert, dass Leute MP3-Player erstellen, die eingebettete Texte lesen?
- 20. Gibt es eine Scheme-Implementierung, die parallelisiert?
- 21. Gibt es Betriebssysteme, die Threading nicht unterstützen?
- 22. Gibt es Mapping-APIs, die Straßendetails bereitstellen?
- 23. Warum gibt es die Basic EventArgs Klasse?
- 24. Gibt es Datenbanken, die Protokollpuffer unterstützen?
- 25. Gibt es Sprachen, die zu Bash kompilieren?
- 26. Gibt es Websites, die Fossil-Repositories hosten?
- 27. Gibt es Sprachen, die Einheiten erlauben?
- 28. Gibt es C# Gesichtserkennungsbibliotheken, die funktionieren?
- 29. Gibt es Javascript-Minifier, die Zeilenumbrüche beibehalten?
- 30. Gibt es eine Möglichkeit, die Vererbung einzuschränken?