Ich verwende Stream Analytics, um Streamingdaten (über IoT Hub) und Referenzdaten (über Blobspeicher) beizutreten. Die Referenzdaten-Blobdatei wird jede Minute mit den neuesten Daten erzeugt und hat das Format "Dateiname- {Datum} {Zeit} .csv". Die Referenz-BLOB-Dateidaten werden in der Azure Machine Learning-Funktion als Parameter in einem SA-Job verwendet. Die Ausgabe des Stream-Analyse-Jobs (in Azure SQL oder Power BI) scheint mehrere Zeilen anstelle von einem für die Ausgabe der Azure Machine Learning-Funktion zu generieren, jeweils eine für Parameterwerte aus früheren BLOB-Dateien. Nach meinem Verständnis sollte es nur den neuesten Inhalt der Blob-Datei verwenden, aber es sieht so aus, als würde es alle Blob-Dateien verwenden und mehrere Zeilen aus der AML-Ausgabe erzeugen. Hier ist die Abfrage Ich verwende.Stream Analytics-Jobreferenzdaten treten bei der Erstellung von Duplikaten auf
SELECT AMLFunction (Ref.Input1, Ref.Input2), * VON IoTInput Stream- LEFT JOIN RefBlobInput Ref ON Stream.DeviceId = Ref [DeviceID]
Bitte Können Sie sich beraten lassen, ob die Abfrage oder der Dateipfad geändert werden muss, um doppelte Datensätze zu vermeiden? Danke