Ich habe ein Programm geschrieben, um Elemente in die DynamoDB-Tabelle zu schreiben. Jetzt möchte ich alle Elemente aus der DynamoDB-Tabelle mit PySpark lesen. Gibt es Bibliotheken in Spark?Verbinden von DynamoDB aus Spark-Programm, um alle Elemente aus einer Tabelle mit Python zu laden?
Q
Verbinden von DynamoDB aus Spark-Programm, um alle Elemente aus einer Tabelle mit Python zu laden?
8
A
Antwort
1
Sie können parallel scans als Teil der DynamoDB API bis boto3 und ein Schema wie die parallele S3-Dateiverarbeitung Anwendung für PySpark beschrieben here beschrieben verwenden. Grundsätzlich, anstatt alle Schlüssel a-priori zu lesen, erstellen Sie einfach eine Liste von Segmentnummern und schreiben die maximale Anzahl der Segmente für den Scan in der map_func
Funktion für Spark fest.
Verwandte Themen
- 1. Wie alle Spalten aus einer Tabelle zu verbinden
- 2. Wie kann ich alle Elemente aus einer DynamoDB-Tabelle abrufen, ohne den Primärschlüssel mit Java anzugeben?
- 3. Python: XPath verwenden, um Daten aus einer Tabelle zu erhalten
- 4. Auswählen von Daten aus MySQL-Tabelle und verwandte Daten aus einem anderen, um sie zu verbinden
- 5. Alle Partitionen aus einer Hive-Tabelle löschen?
- 6. Beste Lösung, um DynamoDb Tabelle zu füllen
- 7. Python alle Elemente aus der Schleife zurückgeben?
- 8. AWS-Fehler beim Verbinden mit DYNAMODB aus der Cloud
- 9. Jquery, um alle Zeilen aus der nächsten Tabelle zu entfernen
- 10. Python - Selenium und XPATH um alle Zeilen aus einer Tabelle zu extrahieren
- 11. Holen Artikel aus dynamodb Tabelle mit separaten Indextabelle mit Node.js
- 12. alle Elemente aus einer Liste löschen
- 13. LINQ Abfrage, um zwei Tabellen zu verbinden und jüngste Datensätze aus Tabelle B entsprechend Tabelle A
- 14. Löschen von Daten aus der DynamoDb-Tabelle automatisch
- 15. Alle Datensätze aus einer Tabelle löschen
- 16. mysql: Wählen Sie alle Elemente aus Tabelle A aus, wenn nicht in Tabelle B
- 17. Ich kämpfe auf dem einfachsten Weg, um Werte dynamisch aus einer Tabelle auszuwählen/zu verbinden
- 18. laden Python-Modul nicht aus einer Datei
- 19. Abrufen eines einzelnen Elements aus DynamoDB mit Python
- 20. Tabelle von Wert aus einer anderen Tabelle
- 21. DynamoDB: Löschen Sie alle Elemente mit gleichen Hash Key
- 22. DELETE Daten aus einer Tabelle, durch zwei Tabellen verbinden
- 23. Alle aus einer Tabelle auswählen und der letzten Verknüpfung aus einer anderen Tabelle beitreten
- 24. MySQL Wählen Sie alle Spalten aus einer Tabelle und einige aus einer anderen Tabelle
- 25. Python Regex, wie alle Übereinstimmungen aus einer Zeichenfolge zu löschen
- 26. Python-Dict mit MySQL-Tabelle verbinden
- 27. auf alle Elemente in einer Tabelle
- 28. So laden Sie xtrareport aus Datei und verbinden Daten
- 29. MySQL bekommen mehrere Elemente aus einer Tabelle als Eingabe für ein einzelnes Feld einer anderen Tabelle
- 30. klar alle Einträge aus einer Tabelle mit PHP
Wir sind Sie in der Lage dies zu tun? – rabz100
Nein, ich habe nur verwendet, was Boto-Dokumentation ohne Funken zur Verfügung gestellt hat. –
Ich würde versuchen, diesen Code zu optimieren - https://github.com/bchew/dynamodump –