Ich möchte Daten über Google Dataflow in die Google CloudSQL-Instanz laden. Ich denke, dass es keine eingebaute Sink für CloudSQL gibt, entscheide ich mich für org.apache.beam.sdk.io.jdbc.JdbcIO. Der Durchsatz in CloudSQL ist jedoch sehr gering (ca. 6 Datensätze/Sek.).Sehr geringer Durchsatz durch Verwendung von JdbcIO in Google Dataflow
Ich vermute, dass die Spezifikation von CloudSQL zu arm ist, aber es gibt keine Verbesserung, wenn es aktualisiert wird.
Im Protokoll des Datenflusses, dort sind viele Protokolle wie folgt:
Proposing dynamic split of work unit my-project;2017-06-27_02_58_19-14077185378147382467;6703504927792172410 at
{"fractionConsumed":0.9669782519340515}
Rejecting split request because custom reader returned null residual source.
Was ist passiert? Und wie kann ich die Leistung verbessern?