Ich frage mich, ob es eine Datenstruktur gibt, die so optimiert ist, dass sie Frequenzen gegen Daten zählt, die in einem datenbanktabellenähnlichen Format gespeichert sind. Beispielsweise werden die Daten in einem (Komma) begrenzten Format darunter angezeigt.Datenstruktur zum Zählen von Häufigkeiten in einem Datenbanktabellen-ähnlichen Format
Jetzt möchte ich einfach die Häufigkeit von col1 = x oder col1 = x und col2 = grün zählen. Ich habe die Daten in einer Datenbanktabelle gespeichert, aber in meinem Profiling und von der empirischen Beobachtung ist Datenbankverbindung der Flaschenhals. Ich habe versucht, In-Memory-Datenbank-Lösungen zu verwenden, und das funktioniert ganz gut; Das einzige Problem sind Speicheranforderungen und skurrile Init/Destroy-Aufrufe.
auch, ich arbeite hauptsächlich mit Java, aber habe Erfahrung mit .net und fragte mich, ob es irgendwelche API gab, mit "tabular" Daten in einer linq Weise mit Java zu arbeiten.
jede Hilfe wird geschätzt.
Wie verwenden Sie die Datenbank? Mit den richtigen Abfragen sollte die Datenbank für das, was Sie tun, gut funktionieren ... –
Ich erstelle einfach eine Datenbanktabelle. Ich weiß, dass es Möglichkeiten gibt, Abfragen zu optimieren (d. h. mit Indizes), aber sie unterscheiden sich von Datenbank zu Datenbank. Außerdem gibt es keine Möglichkeit zu ermitteln, welche Indizes erstellt werden sollen (auf welchen Spalten oder Spaltenkombinationen), da die Algorithmen zur Laufzeit bestimmen, welche Spalten korreliert sind. Außerdem akzeptiert das Programm jeden tabellarischen Datensatz als Eingabe, also erzeuge ich die Datenbanktabellen zur Laufzeit. – jake