Ich habe eine PySpark-Anwendung geschrieben, die eine große Tabelle mit 10 Nachschlagetabellen verbindet und dann eine Transformation für diese Tabelle unter Verwendung der df.when-Klausel durchführt. Das Definieren von df für jede Nachschlagetabelle und deren Verknüpfung nimmt die meisten Zeilen im Skript auf. Wie teste ich das Gerät? verwende ich sc.parallize für jede Nachschlagetabelle und für die Final Table und überprüfe die Transformation? Wie testen Sie die Funkenzündung normalerweise?PySpark Unit Test Ansatz
1
A
Antwort
1
shuaiyuans Kommentar ist gut und Sie sollten vorhandene Frameworks wie py.test zum Testen in Python verwenden. Um die Frage direkter für DataFrames zu beantworten, empfehle ich, dass Sie nicht sc.parallelize
verwenden, sondern stattdessen spark.createDataFrame
verwenden, um den DataFrame zu instanziieren, den Sie an Ihre Funktion übergeben. Dann können Sie df.collect()
für die Ausgabe aufrufen und bestätigen, dass die Anzahl der Zeilen in der Ausgabe wie erwartet ist, sowie die Werte für die Spalten.
Verwandte Themen
- 1. ist Unit-Test-Ansatz ein schlechter?
- 2. CXF-Unit-Test
- 3. Unit Test mathematischen Code
- 4. Wie Unit Test Core WebAPI (net452) Projekt Unit-Test?
- 5. Unit Test Sockets
- 6. Unit Test Geruch
- 7. Unit-Test mit mockresourcerequest
- 8. android unit test spannablestringbuilder
- 9. AngularJS Controller Unit Test
- 10. AngularJS Unit Test Fehlerabhängigkeit
- 11. Spring Unit-Test
- 12. Jasmine Unit-Test-Controller
- 13. Unit Test erwartet System.ServiceModel.FaultException
- 14. Unit Test in Jenkins
- 15. Unity3d Unit Test Ausgabe
- 16. Unit-Test mit NSURLConnection
- 17. Unit-Test-Maven-Plugins
- 18. Unit-Test SessionScoped Klasse
- 19. Ruby Test :: Unit Befehlszeilenoptionen?
- 20. Unit Test Graphics
- 21. QT: simulierter Unit-Test
- 22. Unit-Test JSON Swift
- 23. AngularJs Unit Test Speicherlecks
- 24. Unit-Test verschiedene Flagwerten
- 25. docker unit test setup
- 26. Local Unit Test Android
- 27. Unit-Test LinqToSqlDomainService
- 28. Unit-Test-3-mal
- 29. Unit-Test Sicherheitsmodell ClickOnce
- 30. Unit-Test RedirectToRouteResult
Haben Sie [this] (http://stackoverflow.com/questions/33811882/how-do-i-unit-test-pypspark-programs?rq=1) überprüft? – ShuaiYuan