2017-12-29 4 views
0

Ich versuche, die neue Benutzer- und Benutzeranzahl, qualifizierte Besucher nach benutzerdefinierten Dimensionswert und Datum zu erhalten. Hier ist der Code. Aber ich konnte die Daten nicht mit Google Analytics verknüpfen. Ich denke das Problem ist das UNNEST erstellt doppelte und total.newVisits ist auf unterschiedliche Granularität. Vielen Dank!Google Big Query mit benutzerdefinierter Dimension, um neue Benutzeranzahl und Benutzeranzahl zu erhalten

SELECT 
     PARSE_DATE('%Y%m%d', t.date) as Date 
     ,count(distinct(FullvisitorID)) as visitor_count 
     ,sum(totals.newVisits) AS New_Visitors 
     ,if(customDimensions.index=2, customDimensions.value,null) as orig 
    FROM `table` as t 
     CROSS JOIN UNNEST(hits) AS hit 
     CROSS JOIN UNNEST(hit.customDimensions) AS customDimensions 
    WHERE 
     date='20170101' 

GROUP BY DATE,if(customDimensions.index=2, customDimensions.value,null) 

enter image description here

Antwort

2

Versuchen Sie stattdessen:

SELECT 
    PARSE_DATE('%Y%m%d', date) AS Date, 
    COUNT(DISTINCT fullvisitorid) visitor_count, 
    SUM(totals.newVisits) AS New_Visitors, 
    (SELECT value FROM UNNEST(hits), UNNEST(customDimensions) WHERE index = 2 LIMIT 1) orig 
FROM `dataset_id.ga_sessions_20170101` 
GROUP BY Date, orig 

Es ist im Grunde das Gleiche, aber anstatt die UNNEST in der äußeren Abfrage tut diese Lösung gilt nur diese Operation auf das hit Niveau, das vermeidet die Duplizierung von totals.newVisits, die Sie in Ihrer Abfrage beobachtet haben.

+0

Hallo Willi, Danke für die Hilfe. Ich denke jedoch, dass das neue Besucherkonto und die Besucheranzahl immer noch dupliziert werden. Ich überprüfte das Ergebnis, indem ich die Frage verwendete, die Zahl ist noch wirklich größer als GA. Ich habe die GA-Schnittstelle angeschlossen, die ich verwendet habe. Vielen Dank!!! – Rachel

+0

hmm das ist komisch. Was die Frage betrifft, die ich vorgeschlagen habe, gibt es keinen Ort, an dem die Duplizierung stattfinden könnte. Vielleicht könnten Sie in Ihrem GA-Bericht einige Plausibilitätsprüfungen durchführen, um zu sehen, ob sie wie erwartet erstellt werden. Da der 'visitor_count' eine eindeutige Anzahl ist, kann er nicht dupliziert werden (egal wie viele Duplikate passieren, das Endergebnis ist gleich). –

+0

Ist es möglich, dass ein Benutzerbesuch mehrere Werte für den Kunden-Dimension.index-2 hat? Wenn also die Summierung erfolgt, wird ein Benutzer mehrmals gezählt, aber für andere Werte? – Rachel

Verwandte Themen