Ich versuche, eine Funktion mit bigquery UDF zu schreiben, um eine Liste von Zeichenfolgen mit anderen Zeichenfolgen zu vergleichen. Grundsätzlich möchte ich wissen, wie viele neue Nutzer wir pro Woche haben und von diesen neuen Nutzern, wie viele von ihnen in den kommenden Wochen unsere Website besuchen. Dafür habe ich eine Abfrage erstellt, die mir eine Zeichenkette aller E-Mails pro Woche (mit group_concat) liefert und als Tabelle speichert. Jetzt müssen Sie wissen, wie ich jedes mit anderen Sammlungen von E-Mails pro Woche vergleichen kann. Am Ende würde ich so einen Tisch haben mag:Eine Stringvergleichsfunktion in bigquery schreiben
+----------------+-------+-------+--------+------+
| | week 1 | week 2 | week 3| week 4 | ... |
+----------------+-------+-------+--------+------+
| week1 | 17 | 7 | 5 | 9 | ... |
+----------------+-------+-------+--------+------+
| week2 | | 19 | 13 | 8 | ... |
+-----------------+-------+-------+--------+-----+
| week3 | | | 24 | 15 | ... |
+-----------------+-------+-------+--------+-----+
Das ist eine wirklich gute Antwort! Ich dachte ganz anders. Ich habe den Code bereits mit Java geschrieben. Deshalb habe ich mir überlegt, eine einzigartige Sammlung zu erstellen, um alle E-Mails pro Woche zu speichern und mit anderen Wochen zu vergleichen. Was ich gelesen habe, ist mit UDF nicht möglich. – AnaHid