Ich weiß, dass dies ein älterer Thread, aber es gab einige Entwicklungen im letzten Jahr oder so. Der Vergleich des Data Warehouse mit Hadoop ähnelt dem Vergleich von Äpfeln mit Orangen. Das Data Warehouse ist ein Konzept: saubere, integrierte Daten von hoher Qualität. Ich denke nicht, dass die Notwendigkeit eines Data Warehouse in absehbarer Zeit verschwinden wird. Hadoop hingegen ist eine Technologie. Es handelt sich um ein verteiltes Computing-Framework zur Verarbeitung großer Datenmengen. In der Vergangenheit wurden Data Warehouses typischerweise auf relationalen Datenbanken und Data-Warehouse-Appliances aufgebaut. In den letzten Jahren haben sich jedoch verschiedene Einschränkungen des RDBMS ergeben (explodierende Lizenzkosten angesichts wachsender Datenmengen, schlechte Eignung für die Abfrage von Graphen und Hierarchien und die Aufnahme unstrukturierter Datentypen usw.). Gleichzeitig sind MPP-SQL-Abfrage-Engines in Hadoop erschienen, wie zum Beispiel Apache Drill, die es nun ermöglichen, Daten abzufragen, die sich auf Hadoop befinden.
Ich habe eine ganze Reihe von Beiträgen zum Thema geschrieben, wenn Sie an allen Details interessiert sind. Data Warehousing in the age of big data. The end of an era?