Gibt es eine schnellere Möglichkeit, mysql Update-Abfrage in R zu tun? in Python?

Ich habe versucht, diese Abfrage auszuführen:Gibt es eine schnellere Möglichkeit, mysql Update-Abfrage in R zu tun? in Python?

update table1 A 
set number = (select count(distinct(id)) from table2 B where B.col1 = A.col1 or B.col2 = A.col2);

aber es dauert ewig bc tabelle1 1.100.000 Zeilen hat und table2 hat 350.000.000 Reihen.

Gibt es eine schnellere Möglichkeit, diese Abfrage in R zu tun? oder in Python?

Quelle

2016-05-06 dPdms

Sie können versuchen, Pandas (Bibliothek in Python) – ashish

umschrieb ich Ihre Frage mit drei Unterabfragen anstelle eines - mit UNION und zwei INNER JOIN Aussagen:

UPDATE table1 as A 
SET number = (SELECT COUNT(DISTINCT(id)) 
       FROM 
        (SELECT A.id as id 
        FROM table1 as A 
        INNER JOIN table2 as B 
        ON A.col1 = B.col1) -- condition for col1 

        UNION DISTINCT 

        (SELECT A.id as id 
        FROM table1 as A 
        INNER JOIN table2 as B 
        ON A.col2 = B.col2) -- condition for col2 
      )

Meine Notizen

alle Zeilen in table1 aktualisiert sieht nicht so aus eine gute Idee, weil wir 1.1M Zeilen berühren müssen. Wahrscheinlich wäre eine bessere Leistung haben eine andere Datenstruktur number zum Speichern
versuchen, einen Teil der Abfrage ohne Aktualisierung von table1 (nur ein Teil der Abfrage in Klammern
Werfen Sie einen Blick in EXPLAIN zu laufen, wenn Sie allgemeineren Ansatz brauchen für Optimierung von SQL-Abfragen: https://dev.mysql.com/doc/refman/5.7/en/using-explain.html

Quelle

2016-05-06 07:36:07

Gibt es eine schnellere Möglichkeit, mysql Update-Abfrage in R zu tun? in Python?

Antwort

Verwandte Themen