Ein Kollege hat eine Web-App mit einem PHP-Framework erstellt, wo wir einige API-Aufrufe an andere Systeme konfigurieren können. Diese laufen in der Nacht, um neue Daten in eine Postgres-Datenbank einzutragen. Da es sich bei Postgres um eine OLTP-Datenbank handelt, die nicht für Analysen geeignet ist, habe ich angefangen, über Redshift zu lesen. Aber ich kann einfach nicht herausfinden, wie das alles zusammenpasst.Redshift als Ersatz oder Ergänzung
Oh, und für die Analytik würden wir uns PowerBI ansehen, die DirectQuery mit Redshift verwenden könnte. Aber wie ich es sehe, gibt es für Postgres nichts dergleichen.
Also für meine Frage werde ich alles in vier Teile aufgeteilt:
- Anwendung
- Benutzerdaten für die App (Benutzer, Schemata für die API-Aufrufe) (login, Schnittstelle api Anrufe konfigurieren)
- Daten (Antworten der apis für spätere Analysen)
- Datawarehouse (Speicher für analytische Daten)
Solution | Application | Userdata | Data | Datawarehouse -------- | ----------- | ---------- | ------------- | ---------------- Now | PHP | Postgres | Postgres | 1. | PHP | Postgres | Postgres | Redshift 2. | PHP | Postgres | | Redshift 3. | PHP | Redshift | | Redshift
So ist die Frage: Welche mögliche Lösung ist die "richtige"? Ich könnte die Infrastruktur nutzen, die wir haben, und Redshift hinzufügen. Aber dann verdopple ich die Kosten für die Speicherung. Ich könnte die Anwendungsdaten in einer kleineren Datenbank speichern und die Daten von den APIs direkt in Redshift speichern oder Redshift als einzige Datenbank verwenden.
Aber was ist Ihre Frage? Wie definierst du den "richtigen"? Richtig nach was? –