Kaptár létrehozása, módosítása és amp; Cseppasztal

Tartalomjegyzék:

Anonim

Ebben az oktatóanyagban olyan tábla műveletek figyelhetők meg , mint például a Hive táblák létrehozása, módosítása és eldobása .

Az alábbi képernyőképen létrehozunk egy táblázatot oszlopokkal és megváltoztatjuk a táblázat nevét.

1. A guru_sample tábla létrehozása két oszlopnévvel, például "empid" és "empname"

2. A guru99 adatbázisban jelen lévő táblázatok megjelenítése

3. Guru_minta táblák alatt

4. A "guru_sample" táblázat módosítása "guru_sampleNew" néven

5. A "show" parancs végrehajtásakor ismét megjelenik a Guru_sampleNew új név

Dropping table guru_sampleNew:

Táblázattípusok és azok használata:

A Táblázatokhoz való visszatérés pont olyan, mint ahogyan a hagyományos relációs adatbázisokban létrehozunk. Az olyan funkciók, mint a szűrés, az illesztések, elvégezhetők az asztalokon.

A Hive kétféle táblázati struktúrával foglalkozik, például a belső és a külső táblákkal, a Hive sémájának betöltésétől és kialakításától függően.

Belső táblák

  • A belső tábla szorosan kapcsolódik a természetéhez. Ilyen típusú táblázatokhoz először táblázatot kell létrehoznunk, és be kell tölteni az adatokat.
  • Ezt nevezhetjük a séma adataként .
  • A táblázat eldobásával az adatok és a sémák egyaránt eltávolításra kerülnek.
  • Ennek a táblának a tárolt helye a / user / hive / raktár lesz.

Mikor válasszuk a belső táblázatot:

  • Ha a helyi fájlrendszerben elérhető feldolgozási adatok
  • Ha azt akarjuk, hogy a Hive kezelje az adatok teljes életciklusát, beleértve a törlést is

Minta kódrészlet a belső táblához

1. A belső táblázat létrehozása

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';

2. Töltse be az adatokat a belső táblázatba

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Jelenítse meg a táblázat tartalmát

 Hive>select * from guruhive_internaltable;

4. A belső asztal eldobása

 Hive>DROP TABLE guruhive_internaltable;

Ha eldobta a guruhive_internaltable-t, annak metaadatait és adatait is törli a Hive-ból.

A következő képernyőképen megfigyelhetjük a kimenetet

A fenti kódban és a képernyőképen a következőket tesszük:

  • Készítse el a belső táblázatot
  • Töltse be az adatokat a belső táblába
  • Jelenítse meg a táblázat tartalmát
  • A belső asztal ledobása

Külső táblák

  • A külső asztal lazán kapcsolódik a természethez. Az adatok HDFS-ben lesznek elérhetőek. A táblázat HDFS-adatokra készül.
  • Más módon mondhatjuk, mint az adatok sémájának létrehozása .
  • A táblázat eldobásakor csak a séma csökken, az adatok továbbra is rendelkezésre állnak HDFS-ben, mint korábban.
  • A külső táblák lehetőséget kínálnak arra, hogy több sémát hozzanak létre a HDFS-ben tárolt adatokhoz, ahelyett, hogy minden alkalommal törölnék az adatokat, amikor a séma frissül

Mikor érdemes külső táblázatot választani:

  • Ha HDFS-ben elérhető adatokat dolgoz fel
  • Hasznos, ha a fájlokat a Hive-on kívül használják

Minta kódrészlet a külső táblához

1. Hozzon létre külső táblázatot

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;

2. Ha nem adjuk meg a helyet a táblázat létrehozása idején, akkor manuálisan betölthetjük az adatokat

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Jelenítse meg a táblázat tartalmát

 Hive>select * from guruhive_external;

4. A belső asztal eldobása

 Hive>DROP TABLE guruhive_external;

A következő képernyőképen megfigyelhetjük a kimenetet

A fenti kódban a következő dolgokat tesszük

  • Hozza létre a Külső táblát
  • Töltse be az adatokat a Külső táblázatba
  • Jelenítse meg a táblázat tartalmát
  • Külső asztal eldobása

Különbség a belső Vs külső táblák között

Funkció Belső Külső
Séma Adatok a sémáról Adatok sémája
Tárolási hely / usr / kaptár / raktár HDFS helye
Az adatok elérhetősége A helyi fájlrendszeren belül A HDFS-en belül