Sind Data Warehouses spaltenorientiert?

2 Antworten

Ein Data Warehouse ist eine für Analysezwecke optimierte zentrale Datenbank, die Daten aus mehreren, in der Regel heterogenen Quellen zusammenführt.

Im Prinzip kann ihr Datenschema unterschiedlichste Charakteristik haben, wird i.A. aber doch relational sein (d.h. per SQL definiert).


MrAmazing2 
Beitragsersteller
 28.02.2022, 11:45

Und das heißt was in Bezug auf Spalten- oder Zeilenorientierung?

„unterschiedlichste Charakteristik“ = Beides kommt vor ?

0
grtgrt  28.02.2022, 12:01
@MrAmazing2

Für SQL-Datenbanken gilt: Sie sind tabellenorientiert, aber auch spaltenorientiert (per Views lassen sich Spalten oder ganze Gruppen von Spalten als logische Tabellen sehen) und natürlich auch zeilenorientiert. da aus jeder — auch aus jeder nur logischen — Tabelle ja gezielt Zeilen selektierbar sind.

0
MrAmazing2 
Beitragsersteller
 28.02.2022, 13:02
@grtgrt

Du weißt nicht was spalten- und zeilenorientiert heißt, oder? …

Es geht darum, wie die Daten intern gespeichert sind. Ob du Zeilen selektieren kannst hat damit nichts zu tun. Google mal die beiden Begriffe.

0
grtgrt  28.02.2022, 13:18
@MrAmazing2

Es ist ein Unterschied, ob man von Datenbanken oder Datenbanktechnologien spricht. Aus Sicht der Anwendungen ist ein Data Warehouse zunächst mal eine logische Datenbank (= Instanz eines abstrakten Datentyps).

0

Letztendlich ist es eine Designentscheidung.

Da man für OLAP Queries mit dem Star Schema meist nur wenige Spalten (aber viele Zeilen) braucht bietet sich Column Store an, da man 1) einen höheren Throughput (vs einzelne Zeilen) 2) bessere Cache Effizienz und 3) mehr Möglichkeiten für Kompression hat.

Oder zumindest in der Regel?

Die großen Data Warehouse Systeme wie Snowflake oder SAP BW nutzen afaik eigentlich alle Spaltenorientierte Datenhaltung