Sind Data Warehouses spaltenorientiert?
Ist das generell so? Oder zumindest in der Regel?
Oder gibt‘s Data Warehouses sowohl spalten- als auch zeilenorientiert?
2 Antworten
Ein Data Warehouse ist eine für Analysezwecke optimierte zentrale Datenbank, die Daten aus mehreren, in der Regel heterogenen Quellen zusammenführt.
Im Prinzip kann ihr Datenschema unterschiedlichste Charakteristik haben, wird i.A. aber doch relational sein (d.h. per SQL definiert).
Für SQL-Datenbanken gilt: Sie sind tabellenorientiert, aber auch spaltenorientiert (per Views lassen sich Spalten oder ganze Gruppen von Spalten als logische Tabellen sehen) und natürlich auch zeilenorientiert. da aus jeder — auch aus jeder nur logischen — Tabelle ja gezielt Zeilen selektierbar sind.
Du weißt nicht was spalten- und zeilenorientiert heißt, oder? …
Es geht darum, wie die Daten intern gespeichert sind. Ob du Zeilen selektieren kannst hat damit nichts zu tun. Google mal die beiden Begriffe.
Es ist ein Unterschied, ob man von Datenbanken oder Datenbanktechnologien spricht. Aus Sicht der Anwendungen ist ein Data Warehouse zunächst mal eine logische Datenbank (= Instanz eines abstrakten Datentyps).
Letztendlich ist es eine Designentscheidung.
Da man für OLAP Queries mit dem Star Schema meist nur wenige Spalten (aber viele Zeilen) braucht bietet sich Column Store an, da man 1) einen höheren Throughput (vs einzelne Zeilen) 2) bessere Cache Effizienz und 3) mehr Möglichkeiten für Kompression hat.
Oder zumindest in der Regel?
Die großen Data Warehouse Systeme wie Snowflake oder SAP BW nutzen afaik eigentlich alle Spaltenorientierte Datenhaltung
Und das heißt was in Bezug auf Spalten- oder Zeilenorientierung?
„unterschiedlichste Charakteristik“ = Beides kommt vor ?