Mi az a nagy adat? Bevezetés, típusok, jellemzők, példa

Tartalomjegyzék:

Anonim

Mielőtt a Big Data bevezetésére térnénk, először tudnia kell

Mi az adat?

Azok a mennyiségek, karakterek vagy szimbólumok, amelyeken a számítógép műveleteket hajt végre, amelyeket elektromos jelek formájában tárolhatnak és továbbíthatnak, és mágneses, optikai vagy mechanikus adathordozókra rögzíthetnek.

Most tanuljuk meg a Big Data bevezetését

Mi a Big Data?

A Big Data olyan adatgyűjtemény, amely hatalmas mennyiségű, ugyanakkor az idővel exponenciálisan növekszik. Olyan nagy méretű és összetett adatról van szó, hogy a hagyományos adatkezelő eszközök egyike sem képes ezeket tárolni vagy hatékonyan feldolgozni. A nagy adatok szintén adatok, de hatalmas méretűek.

Ebben az oktatóanyagban megtanulod,

  • Mi az adat?
  • Mi a Big Data?
  • Példák a nagy adatokra
  • A nagy adatok típusai
  • A nagy adatok jellemzői
  • A nagy adatfeldolgozás előnyei

Példák a nagy adatokra

Az alábbiakban bemutatunk néhány Big Data példát -

A New York-i tőzsde naponta körülbelül egy terabájt új kereskedési adatot generál .

Közösségi média

A statisztikák azt mutatják, hogy minden nap 500 + terabájt új adat kerül be a Facebook közösségi oldal adatbázisaiba . Ezeket az adatokat elsősorban a fénykép- és videofeltöltések, az üzenetváltás, a megjegyzések stb.

Egyetlen sugárhajtású motor 10 + terabájt adatot képes előállítani 30 perc repülési idő alatt. Napi sok ezer repüléssel az adatok generálása akár sok petabájtot is elérhet .

A nagy adatok típusai

Az alábbiakban bemutatjuk a Big Data típusait:

  1. Strukturált
  2. Strukturálatlan
  3. Félig strukturált

Strukturált

Minden rögzített formátumban tárolható, hozzáférhető és feldolgozható adatot „strukturált” adatnak nevezünk. Az idő alatt a számítástechnika tehetsége nagyobb sikereket ért el az ilyen jellegű adatokkal való munka technikáinak kifejlesztésében (ahol a formátum előre jól ismert), és értéket is nyert belőle. Manapság azonban olyan kérdéseket látunk előre, amikor az ilyen adatok nagymértékben megnőnek, a tipikus méretek több zettabájt dühében vannak.

Tudod? 10 21 bájt egyenlő az 1 zettabyte vagy egy milliárd terabájt formák egy zettabyte .

Ezeket az ábrákat megnézve könnyen megérthető, hogy miért adják a Big Data nevet, és elképzelhetjük a tárolásával és feldolgozásával járó kihívásokat.

Tudod? A relációs adatbázis-kezelő rendszerben tárolt adatok a „strukturált” adatok egyik példája .

Példák strukturált adatokra

Az adatbázisban található „Munkavállaló” tábla példa a strukturált adatokra

Munkavállalói azonosító Alkalmazott Neve Nem Osztály Fizetés_In_lacs
2365 Rajesh Kulkarni Férfi Pénzügy 650000
3398 Pratibha Joshi Női Rendszergazda 650000
7465 Shushil Roy Férfi Rendszergazda 500000
7500 Shubhojit Das Férfi Pénzügy 500000
7699 Priya Sane Női Pénzügy 550000

Strukturálatlan

Minden ismeretlen formájú vagy felépítésű adat strukturálatlan adatnak minősül. Amellett, hogy a méret óriási, a strukturálatlan adatok számos kihívást jelentenek feldolgozása szempontjából, hogy értéket lehessen belőle származtatni. A strukturálatlan adatok tipikus példája egy heterogén adatforrás, amely egyszerű szöveges fájlok, képek, videók stb. Kombinációját tartalmazza. A nap szervezeteinek rengeteg adata áll rendelkezésre, de sajnos nem tudják, hogyan lehetne belőlük értéket nyerni, mivel ezek az adatok nyers formában vagy strukturálatlan formátumban vannak.

Példák strukturálatlan adatokra

A „Google Search” által kimenet

Félig strukturált

A félig strukturált adatok mindkét adatformát tartalmazhatnak. Láthatjuk a félig strukturált adatokat strukturált formában, de valójában nincs meghatározva pl. Egy táblázati definícióval a relációs DBMS-ben. A félig strukturált adatok példája egy XML fájlban megjelenített adat.

Példák félig strukturált adatokra

XML fájlban tárolt személyes adatok-

Prashant RaoMale35Seema R.Female41Satish ManeMale29Subrato RoyMale26Jeremiah J.Male35

Az adatok növekedése az évek során

Felhívjuk figyelmét, hogy a webalkalmazás strukturálatlan adatai naplófájlokból, tranzakciós előzmények fájlokból stb. Állnak. Az OLTP rendszerek strukturált adatokkal való együttműködésre vannak kialakítva, ahol az adatokat relációkban (táblákban) tárolják.

A nagy adatok jellemzői

A nagy adatok a következő jellemzőkkel írhatók le:

  • Hangerő
  • Fajta
  • Sebesség
  • Változékonyság

(i) Kötet - maga a Big Data név egy hatalmas mérethez kapcsolódik. Az adatok nagysága nagyon fontos szerepet játszik az adatok értékének meghatározásában. Az is, hogy egy adott adat valóban nagy adatnak tekinthető-e vagy sem, az adatok mennyiségétől függ. Ezért a „kötet” az egyik jellemző, amelyet figyelembe kell venni a Big Data kezelése során.

(ii) változatosság - A Big Data következő aspektusa a változatossága .

A változatosság heterogén forrásokra és az adatok természetére utal, mind strukturált, mind strukturálatlan. A korábbi napokban a táblázatok és az adatbázisok voltak az egyetlen adatforrás, amelyet a legtöbb alkalmazás figyelembe vett. Manapság az elemzési alkalmazásokban e-mailek, fényképek, videók, megfigyelő eszközök, PDF-ek, hang stb. Formájában is figyelembe veszik az adatokat. A strukturálatlan adatok ilyen sokfélesége bizonyos kérdéseket vet fel az adatok tárolásával, bányászatával és elemzésével kapcsolatban.

(iii) Sebesség - A „sebesség” kifejezés az adatok előállításának sebességére utal. Az adatok generálásának és feldolgozásának gyorsasága meghatározza az adatok valódi potenciálját.

A Big Data Velocity az adatok olyan forrásokból történő beáramlásának sebességével foglalkozik, mint az üzleti folyamatok, az alkalmazásnaplók, a hálózatok és a közösségi média webhelyek, az érzékelők, a mobileszközök stb.

(iv) Változékonyság - Ez arra a következetlenségre utal, amelyet az adatok időnként kimutathatnak, ezáltal akadályozva az adatok hatékony kezelésének és kezelésének folyamatát.

A nagy adatfeldolgozás előnyei

A Big Data feldolgozásának képessége számos előnnyel jár, például

    • A vállalkozások kihasználhatják a külső intelligenciát, miközben döntéseket hoznak

A keresőmotorokból és olyan webhelyekről származó hozzáférés a közösségi adatokhoz, mint a facebook, a twitter, lehetővé teszi a szervezetek számára, hogy finomítsák üzleti stratégiáikat.

    • Javított ügyfélszolgálat

A hagyományos ügyfél-visszajelzési rendszereket felváltják a Big Data technológiákkal tervezett új rendszerek. Ezekben az új rendszerekben a Big Data és a természetes nyelv feldolgozási technológiáit használják a fogyasztói válaszok elolvasására és értékelésére.

    • A termékre / szolgáltatásra jelentett kockázat korai azonosítása, ha van ilyen
    • Jobb működési hatékonyság

A Big Data technológiák felhasználhatók az új adatok átmeneti területének vagy leszállási zónájának létrehozására, mielőtt meghatároznák, milyen adatokat kell áthelyezni az adattárházba. Ezenkívül a Big Data technológiák és az adattárház ilyen integrációja segíti a szervezetet a ritkán hozzáférhető adatok kirakásában.

Összegzés

  • Big Data definíció: A Big Data olyan adat, amely hatalmas méretű. A Bigdata egy olyan adatgyűjtemény, amely hatalmas méretű, de az idővel exponenciálisan növekszik.
  • A Big Data elemzési példák közé tartoznak a tőzsdék, a közösségi oldalak, a sugárhajtóművek stb.
  • A Big Data lehet 1) strukturált, 2) strukturálatlan, 3) félig strukturált
  • A hangerő, a változatosság, a sebesség és a változékonyság csak néhány nagy adat jellemző
  • A jobb ügyfélszolgálat, a jobb működési hatékonyság, a jobb döntéshozatal a Bigdata néhány előnye