A 30 legfontosabb Hbase interjúkérdés & Válaszok

Anonim

PDF letöltése

Az alábbiakban gyakran feltett kérdéseket kapunk a friss tanulóknak és a tapasztalt HBase fejlesztőknek készített interjúk során.

1) Magyarázza el, mi a Hbase?

A Hbase egy oszloporientált adatbázis-kezelő rendszer, amely a HDFS (Hadoop Distribute File System) tetején fut. A Hbase nem relációs adattár, és nem támogatja az SQL-hez hasonló strukturált lekérdezési nyelvet.

A Hbase-ben egy fő csomópont szabályozza a fürtöt és a régiós kiszolgálókat a táblák részeinek tárolásához, és az adatokkal kapcsolatos munkát kezeli.

2) Magyarázza el, miért kell használni a Hbase-t?

  • Nagy kapacitású tárolórendszer
  • Elosztott dizájn a nagy asztalok kiszolgálására
  • Oszloporientált üzletek
  • Vízszintesen méretezhető
  • Nagy teljesítmény és elérhetőség
  • A Hbase alapvető célja oszlopok milliói, változatok ezrei és sorok milliárdjai
  • A HDFS-től (Hadoop Distribute File System) ellentétben véletlenszerű valós idejű CRUD műveleteket támogat

3) Említse meg, melyek a Hbase legfontosabb elemei?

  • Zookeeper: Végzi a koordinációs munkát az ügyfél és a Hbase Maser között
  • Hbase Master: A Hbase Master figyeli a Region Server kiszolgálót
  • RegionServer: A RegionServer figyeli a régiót
  • Régió: A memória adattárában (MemStore) és a Hfile-ben található.
  • Katalógus táblázatok: A katalógus táblázatok ROOT és META elemekből állnak

4) Magyarázza el, miből áll a Hbase?

  • A Hbase táblákból áll
  • És minden táblázat sorokat és oszlopokat tartalmaz, mint a hagyományos adatbázis
  • Minden táblának tartalmaznia kell egy Elsődleges kulcsként definiált elemet
  • A Hbase oszlop egy objektum attribútumát jelöli

5) Hány operatív parancsot említsen meg a Hbase-ben?

Az operatív parancs a Hbases-ben körülbelül ötféle

  • Kap
  • Tedd
  • Töröl
  • Letapogatás
  • Növekedés

6) Magyarázza el, mi a WAL és a Hlog a Hbase-ben?

A WAL (Write Ahead Log) hasonló a MySQL BIN naplóhoz; rögzíti az adatokban bekövetkező összes változást. Ez egy Hadoop szabványos szekvenciafájl, amely a HLogkey fájlokat tárolja. Ezek a kulcsok egy sorszámból, valamint a tényleges adatokból állnak, és a szerver összeomlása után a még nem megmaradt adatok visszajátszására szolgálnak. Tehát, a kiszolgáló meghibásodása esetén a WAL életvonalként működik, és lekéri az elveszett adatokat.

7) Mikor érdemes használni a Hbase-t?

  • Hatalmas adatméret: Ha rengeteg és több millió rekord áll rendelkezésére
  • Teljes újratervezés: Ha az RDBMS-t Hbase-be költözteti, akkor azt teljes újratervezésnek tekinti, csak pusztán a portokat változtatja meg
  • SQL-Less parancsok: Számos szolgáltatása van, például tranzakciók; belső illesztések, gépelt oszlopok stb.
  • Infrastrukturális beruházás: Ahhoz, hogy a Hbase valóban hasznos lehessen, elegendő klaszterrel kell rendelkeznie

8) A Hbase-ben mi az oszlopcsalád?

Az oszlopcsaládok tartalmazzák a Hbase fizikai tárolásának alapvető egységét, amelyre olyan funkciókat alkalmaznak, mint a tömörítések.

9) Magyarázza el, mi a sor kulcsa?

A sor kulcsát az alkalmazás határozza meg. Mivel a kombinált kulcsot előre rögzíti a soros kulcs, ez lehetővé teszi az alkalmazás számára, hogy meghatározza a kívánt rendezési sorrendet. Lehetővé teszi a cellák logikai csoportosítását is, és győződjön meg arról, hogy az összes, ugyanazzal a sorral rendelkező cella együtt helyezkedik el ugyanazon a kiszolgálón.

10) Magyarázza a törlést a Hbase-ben? Említse meg, mi a három típusú síremlék jelölő a Hbase-ben?

A Hbase cellájának törlésekor az adatok nem törlődnek, hanem egy sírkő jelölőt állítanak be, ami a törölt cellákat láthatatlanná teszi. A törölt Hbase törlődik a tömörítés során.

Háromféle síremlék van:

  • Verzió törlés jelölő: Törléshez az oszlop egyetlen verzióját jelöli
  • Oszlop törlése: Törléshez az oszlop összes verzióját megjelöli
  • Család törlés jelölő: Törléshez az oszlopcsalád összes oszlopát megjelöli

11) Magyarázza el, hogyan törli a Hbase egy sort?

A Hbase-ben bármit írsz, RAM-ról lemezre tárol, ezek a lemezírások megváltoztathatatlanok, így a tömörítés nem lehetséges. A Hbase törlési folyamata során a nagyobb tömörítési folyamat törli a jelzőt, míg a kisebb tömörítések nem. Normál törlés esetén törlési sírkövet jelöl - ezek az általuk képviselt törlési adatok törlésre kerülnek.

Ha törli az adatokat és több adatot ad hozzá, de a sírkő időbélyegzőjénél korábbi időbélyegzővel rendelkezik, akkor a további Gets elfedhető a törlés / sírkő jelölővel, így a beillesztett értéket csak a nagyobb tömörítés után kapja meg.

12) Magyarázza el, mi történik, ha megváltoztatja az oszlopcsalád blokkméretét egy már elfoglalt adatbázisban?

Az oszlopcsalád blokkméretének módosításakor az új adatok elfoglalják az új blokkméretet, míg a régi adatok a régi blokkméreten belül maradnak. Az adatok tömörítése során a régi adatok átveszik az új blokkméretet. Az új fájlok kiürítésükkor új blokkmérettel rendelkeznek, míg a meglévő adatok továbbra is helyesen olvashatók. Minden adatot át kell alakítani az új blokkméretre, a következő nagyobb tömörítés után.

13) Említse meg a különbséget a Hbase és a Relációs adatbázis között?

Hbase Relációs adatbázis
  • Séma nélküli
  • Oszloporientált adattár
  • A nem normalizált adatok tárolására szolgál
  • Ritkán lakott táblázatokat tartalmaz
  • Az automatizált particionálás a Hbase-ben történik
  • Ez egy séma alapú adatbázis
  • Ez egy sor-orientált adattár
  • Normalizált adatok tárolására szolgál
  • Vékony asztalokat tartalmaz
  • Nincs ilyen rendelkezés vagy beépített támogatás a particionáláshoz

14) Mi a HBaseFsck osztály?

Van egy visszahívott eszköznév a HBase-ben, amelyet a HBaseFsck osztály valósít meg. Számos parancssori kapcsolót kínál, amelyek befolyásolják a viselkedését.

15) Melyek a HBase főbb struktúrái?

A sor kulcs és az oszlop kulcs a két legfontosabb kulcsszerkezet, amelyet a HBase használ

16) Beszélje meg, hogyan használhatja a szűrőket az Apache HBase alkalmazásban

Szűrők a HBase Shellben. Az Apache HBase 0.92-ben vezették be, amely segít kiszolgálóoldali szűrést végezni a HBase eléréséhez a HBase shell vagy takarékosság révén.

17) A HBase támogatja a szintaxis felépítését, mint például az SQL igen vagy nem?

Nem, sajnos a HBase SQL támogatása jelenleg nem érhető el. Az Apache Phoenix használatával azonban SQL lekérdezéseken keresztül lekérhetünk adatokat a HBase-ről.

18) Mit jelent a tömörítés a HBase-ben?

A nehéz beérkező írások idején lehetetlen optimális teljesítményt elérni azáltal, hogy táronként egy fájl van. A HBase segít kombinálni ezeket a HF fájlokat, hogy csökkentse a lemezmagok számát minden olvasáskor. Ez a folyamat a HBase-ben tömörítés néven ismert.

19) Hogyan fogja megvalósítani a csatlakozásokat a HBase-ben?

A HBase nem támogatja közvetlenül a csatlakozásokat, de a MapReduce jobokat használja. A csatlakozási lekérdezéseket az adatok különböző HBase táblázatok segítségével történő lekérésével lehet végrehajtani.

20) Magyarázza el a JMX-t a HBSE-vel kapcsolatban

A Java Management Extensions vagy a JMX a Java alkalmazások exportálási állapota.

21) Mi a MasterServer használata?

A Master Sever segít egy régió hozzárendelésében a régió szerverhez is. Ez a terheléselosztás kezelésében is segítséget nyújt, mi a MasterServert használjuk.

22) Határozza meg a takarékosság kifejezést

Az Apache Thrift C ++ nyelven íródott. Sémafordítókat biztosít különféle programozási nyelvekhez, például C ++, Perl, PHP, Python, Ruby és még sok máshoz.

23) Miért érdemes használni a HColumnDescriptor osztályt?

Az oszlopcsaládra vonatkozó részleteket, például a tömörítési beállításokat, a verziószámot, a. HColumnDescriptor tárolja.

24) Mi a sejt a HBase-ben?

A HBase cellája a Hbase táblázat legkisebb egysége. Segít abban, hogy egy adatot egy {sor, oszlop, verzió} formájában tároljon

25) Mi az a Bloom szűrő?

A HBase támogatja a Bloom Filter funkciót, amely javítja a fürt teljes átviteli sebességét. A HBase Bloom Filter egy helytakarékos mechanizmus annak tesztelésére, hogy a HFile tartalmaz-e bizonyos sorokat vagy sor-col cellákat.

26) Meséljen a HBase műveletek típusairól?

Ans. A HBase műveletek két típusa a következő:

  • Olvassa el a Műveletet
  • Írási művelet

27) Mi a HBase HMaster alkalmazása?

A mester fő feladatai:

  1. A régió szervereinek koordinálása
  2. Az adminisztrátor funkciói

28) Melyik technikát használhatja a HBase-ben a HFile közvetlen eléréséhez a HBase segítsége nélkül?

A HFile közvetlen eléréséhez a HBase használata nélkül a HFile.main () metódust használjuk.

29) A régiószerver megtalálható-e az összes DataNode-on?

Igen, a Region Server kiszolgálók ugyanazokon a kiszolgálókon futnak, mint a DataNodes

30) Nevezze meg azt a szűrőt, amely az oldalméretet elfogadja paraméterként a HBase-ben

A PageFilter nevű szűrő elfogadja az oldal méretét paraméterként.

Ez a dokumentum az azonnali HTML-átalakító eszközökkel készült.