Ich bin neu bei Elasticsearch und ich lese hier https://www.elastic.co/guide/en/elasticsearch/plugins/master/mapper-attachments.html, dass das Mapper-Anhänge-Plugin in Elasticsearch 5.0.0 veraltet ist.Wie indiziert man eine PDF-Datei in Elasticsearch 5.0.0 mit Ingest-Anhang-Plugin?
Ich versuche nun, eine PDF-Datei mit dem neuen Ingest-Anhang-Plugin zu indizieren und den Anhang hochzuladen.
Was ich bisher versucht habe, ist
curl -H 'Content-Type: application/pdf' -XPOST localhost:9200/test/1 -d @/cygdrive/c/test/test.pdf
aber ich bekomme die folgende Fehlermeldung:
{"error":{"root_cause":[{"type":"mapper_parsing_exception","reason":"failed to parse"}],"type":"mapper_parsing_exception","reason":"failed to parse","caused_by":{"type":"not_x_content_exception","reason":"Compressor detection can only be called on some xcontent bytes or compressed xcontent bytes"}},"status":400}
Ich würde erwarten, dass die PDF-Datei indiziert werden und hochgeladen. Was mache ich falsch?
Ich habe auch Elasticsearch 2.3.3 getestet, aber das Mapper-Attachment-Plugin ist nicht gültig für diese Version und ich möchte keine ältere Version von Elasticsearch verwenden.
Warum benötigen Sie eine Zuordnung für das Datenfeld? Nimmt die Pipeline das Datenfeld nicht auf und verarbeitet es, ohne dass es explizit zugeordnet werden muss? Wie würde dieses Mapping aussehen? – bjlevine
@bjlevine Sie müssen nicht das Feld tatsächlich zuordnen ... der Prozessor wird ein Innen (von Ihrem Prozessor) das Feld erstellen. Aber manchmal müssen Sie einen Filter wie die aktualisierte Antwort haben. hoffe, es hilft – Evis
Ich habe viel mit Ingest Attachment Plugin gekämpft. Es kann nicht in der Produktion verwendet werden. Ich benutze Ambar (http://ambar.rdseventeen.com) als eine solide Lösung zum Stroaken und Durchsuchen von Dokumenten – SochiX