Csillag és hópehely séma az adattárházban példákkal

Tartalomjegyzék:

Anonim

Mi az a többdimenziós séma?

A Többdimenziós séma kifejezetten az adattárházi rendszerek modellezésére szolgál. A sémákat úgy tervezték, hogy kielégítsék az analitikai célokra tervezett nagyon nagy adatbázisok (OLAP) egyedi igényeit.

Az adattárház sémájának típusai:

A következőkben a multidimenzionális sémák 3 fő típusát mutatjuk be, amelyek mindegyikének megvannak az egyedi előnyei.

  • Csillag séma
  • Hópehely séma
  • Galaxy séma

Ebben az oktatóanyagban többet megtudhat-

  • Mi az a csillagséma?
  • Mi az a hópehely séma?
  • Csillagséma Vs hópehely séma: Fő különbségek
  • Mi az a Galaxy séma?
  • Mi a Csillagfürt séma?

Mi az a csillagséma?

Csillagséma az adattárházban, amelyben a csillag közepén egy ténytábla és számos társított dimenziótábla lehet. Csillagséma néven ismert, mivel szerkezete egy csillagra hasonlít. A Star Schema adatmodell a Data Warehouse séma legegyszerűbb típusa. Star Join Schema néven is ismert, és nagy adatkészletek lekérdezésére optimalizálták.

A következő Csillagséma-példában a ténytábla áll középen, amely minden dimenziótábla kulcsát tartalmazza, például Kereskedő_ID, Modellazonosító, Dátum_ID, Termék_ID, Ágazonosító és egyéb attribútumok, például Eladott egységek és bevétel.

Példa a csillag séma diagramjára

A csillag séma jellemzői:

  • A csillagséma minden dimenzióját az egyetlen egydimenziós tábla képviseli.
  • A dimenziótáblának tartalmaznia kell az attribútumkészletet.
  • A dimenziótábla egy idegen kulccsal kapcsolódik a ténytáblához
  • A dimenziótábla nincs összekapcsolva egymással
  • A ténytábla kulcsot és mértéket tartalmazna
  • A Star séma könnyen érthető és optimális lemezhasználatot biztosít.
  • A dimenziótáblák nincsenek normalizálva. Például a fenti ábrán az Ország_azonosító nem rendelkezik olyan országkeresési táblázattal, amely az OLTP-tervnek megfelelne.
  • A sémát a BI Tools széles körben támogatja

Mi az a hópehely séma?

A hópehely séma az adattárházban egy táblák logikai elrendezése egy többdimenziós adatbázisban, így az ER diagram hópehely alakra hasonlít. A hópehely séma a csillag séma kiterjesztése, és további dimenziókat ad hozzá. A dimenziótáblák normalizálódnak, ami további táblákra osztja az adatokat.

A következő hópehely séma példában az ország tovább normalizálódik egy egyéni táblává.

Példa a hópehely sémára

A hópehely séma jellemzői:

  • A hópehely séma fő előnye, hogy kisebb lemezterületet használ fel.
  • A séma könnyebben megvalósítható egy dimenzióval
  • Több tábla miatt a lekérdezés teljesítménye csökken
  • Az elsődleges kihívás, amellyel szembe kell néznie a hópehely séma használata során, hogy több karbantartási erőfeszítést kell végrehajtania a több keresőtábla miatt.

Csillagséma Vs hópehely séma: Fő különbségek

Az alábbiakban bemutatjuk a legfontosabb különbséget a Csillag séma és a Hópehely séma között:

Csillag séma Hópehely séma
A dimenziók hierarchiáit a dimenziós táblázat tárolja. A hierarchiák külön táblákra vannak felosztva.
Dimenziótáblákkal körülvett ténytáblát tartalmaz. Egy ténytábla dimenziótáblával körülvéve, amelyeket viszont dimenziótábla vesz körül
Csillagsémában csak egyetlen összekapcsolás hozza létre a kapcsolatot a ténytábla és az összes dimenziótábla között. Egy hópehely séma sok csatlakozást igényel az adatok lekéréséhez.
Egyszerű DB tervezés. Nagyon összetett DB tervezés.
A denormalizált adatstruktúra és a lekérdezés is gyorsabban fut. Normalizált adatstruktúra.
Magas szintű adatredundancia Nagyon alacsony szintű adatredundancia
Az Egy dimenzió táblázat összesített adatokat tartalmaz. Adatok felosztása különböző dimenziótáblákra.
A kocka feldolgozása gyorsabb. A kocka feldolgozása lassú lehet a komplex összekapcsolódás miatt.
Nagyobb teljesítményű lekérdezéseket kínál a Csatlakozás a lekérdezés optimalizálás segítségével. Az asztalok több dimenzióval is összekapcsolhatók. A Hópehely sémát egy központosított ténytábla képviseli, amely valószínűleg nem kapcsolódik több dimenzióhoz.

Mi az a Galaxy séma?

A Galaxy Schema két ténytáblát tartalmaz, amelyek megosztják a dimenziótáblákat közöttük. Ténykonstellációs sémának is hívják. A sémát csillagok gyűjteményeként tekintik, ezért a Galaxy Schema név.

Példa a Galaxy sémára

Amint a fenti példában láthatja, két ténytábla van

  1. Bevétel
  2. Termék.

A Galaxy sémában a megosztások dimenzióit Conformed Dimensions-nek nevezzük.

A Galaxy séma jellemzői:

  • A séma dimenziói külön dimenziókra vannak felosztva a hierarchia különböző szintjei alapján.
  • Például, ha a földrajznak négy hierarchiaszintje van, például régió, ország, állam és város, akkor a Galaxy sémának négy dimenzióval kell rendelkeznie.
  • Ezenkívül lehetséges az ilyen típusú sémák felépítése úgy, hogy az egycsillagos sémát több Star sémára osztja fel.
  • A dimenziók nagyok ebben a sémában, amelyre a hierarchia szintjei alapján van szükség.
  • Ez a séma hasznos a ténytáblák összesítéséhez a jobb megértés érdekében.

Mi a Csillagfürt séma?

A Hópehely séma teljesen kibővített hierarchiákat tartalmaz. Ez azonban bonyolultabbá teheti a sémát, és további csatlakozásokat igényel. Másrészt a csillagséma teljesen összeomlott hierarchiákat tartalmaz, ami redundanciához vezethet. Tehát a legjobb megoldás lehet a két séma közötti egyensúly, amely a Csillagfürt séma kialakítása.

Példa Csillagfürt sémára

Az átfedő dimenziók villaként megtalálhatók a hierarchiákban. Elágazás akkor történik, amikor az entitás két különböző dimenziós hierarchiában szülőként működik. Ezután a villás entitások besorolásnak minősülnek, egy-sok kapcsolattal.

Összegzés:

  • A többdimenziós séma kifejezetten az adattárház-rendszerek modellezésére szolgál
  • A csillag séma a Data Warehouse séma legegyszerűbb típusa. Csillagséma néven ismert, mivel szerkezete egy csillagra hasonlít.
  • A hópehely séma a csillag séma kiterjesztése, és további dimenziókat ad hozzá. Hópehelynek hívják, mert diagramja hópehelyre hasonlít.
  • Csillagsémában csak az egyesítés határozza meg a ténytábla és az összes dimenziótábla közötti kapcsolatot.
  • A Csillagséma ténytáblát tartalmaz, dimenziótáblákkal körülvéve.
  • A hópehely sémát dimenziótábla veszi körül, amelyeket viszont dimenziótábla vesz körül
  • Egy hópehely séma sok csatlakozást igényel az adatok lekéréséhez.
  • A Galaxy séma két ténytáblát tartalmaz, amelyek megosztják a dimenziótáblákat. Ténykonstellációs sémának is hívják.
  • A csillagfürt séma a Csillag és a Hópehely séma attribútumait tartalmazza.