Kann CSV-Dateien aus dem AWS S3 Eimer direkt in ML zu konfigurierenden gehen oder tun die Dateien irgendwo und dann landen müssen die CSV-Dateien MCLP aufgenommen werden verwenden?CSV-Dateien von AWS S3 bis 8 Marklogic
Antwort
Angenommen, Sie haben CSV-Dateien im S3-Bucket und eine Zeile in der CSV-Datei wird als einzelner XML-Datensatz eingefügt ... das war in Ihrer Frage nicht klar, ist aber der häufigste Anwendungsfall. Wenn Sie die Dateien einfach als CSV-Dateien abrufen und persistieren möchten, gibt es undokumentierte XQuery-Funktionen, die für den Zugriff auf den S3-Bucket verwendet werden können und die Dateien aus diesem entfernen. Wie auch immer, die MLCP-Dokumente sind sehr hilfreich, um dieses sehr vielseitige und mächtige Werkzeug zu verstehen.
in die Dokumentation Laut (https://developer.marklogic.com/products/mlcp) die unterstützten Datenquellen sind:
- lokales Dateisystem
- HDFS
- Marklogic Archive
- Eine weitere Marklogic-Datenbank
Sie könnten möglicherweise montieren der S3 Bucket zu einem lokalen Dateisystem auf EC2 um die Notwendigkeit zu umgehen, die f zu machen für MLCP zugänglich. Google ist dein Freund, wenn das wichtig ist. Ich persönlich habe dafür keine produktionsstabile Methode gesehen, aber es ist lange her, seit ich es versucht habe.
Egal, müssen Sie diese Dateien auf einer unterstützte Quelle, höchstwahrscheinlich eine Position im Dateisystem in diesem Fall zur Verfügung stellen, wo MLKP ausgeführt werden kann und die Dateien erreichen. Ich nehme an, du hast damit gemeint, die Dateien irgendwo landen zu lassen. MLCP kann Dateien mit Trennzeichen im Importmodus verarbeiten. Die Dokumentation ist sehr gut für das Verständnis aller Optionen.
- 1. AWS S3 Dateien von Python
- 2. Marklogic 8: in Masse löschen
- 3. Upload von AWS Lambda zu AWS S3
- 4. Brechen von AWS S3 Uploads
- 5. Einfache Datei-Upload bis S3 aws-sdk und Node/Express
- 6. AWS Cognito und S3
- 7. aws s3 maximale Dateigröße
- 8. AWS s3 r studio
- 9. AWS S3-Zugriff verweigert
- 10. AWS S3 - Benutzerprofil speichern
- 11. Sortierung mehrerer Karten in marklogic 8
- 12. AWS S3 Presigned-Anforderungscache
- 13. aws s3 mv/sync-Befehl
- 14. MarkLogic 8 und serverseitiges JavaScript - Debugging-Unterstützung
- 15. marklogic 8 - Wie man Sammlung klug sucht
- 16. AWS S3-Zertifikat-/Zertifikatfehler
- 17. Herunterladen von yfcc100m von aws s3 bucket
- 18. Wie gespeicherte S3-Bucket-Daten in marklogic 8 durchsuchbar machen. REST API
- 19. tar.gz bis S3 Eimer
- 20. AWS S3 mit Grails
- 21. Android und AWS S3
- 22. Aws S3 CompleteMultipartUpload-Fehler
- 23. AWS CLI S3 Zugriff
- 24. AWS S3 Lightsail Schnappschüsse
- 25. AWS S3 Bucket Endpunkt
- 26. AWS S3 Objektliste
- 27. S3 Upload-Fehler in aws
- 28. AWS Schritt Funktion - Warte bis ein Ereignis
- 29. CORS AWS S3 und Cloudfront
- 30. View Box in der Admin-Konsole von MarkLogic 8 erstellen