Mi az a felügyelt gépi tanulás?
A felügyelt tanulás során a gépet jól "felcímkézett " adatok felhasználásával oktatja . Ez azt jelenti, hogy néhány adatot már a helyes válasz megcímkézett. Összehasonlítható a szupervízor vagy a tanár jelenlétében zajló tanulással.
A felügyelt tanulási algoritmus címkézett képzési adatokból tanul, segít megjósolni az előre nem látható adatok kimenetelét. A pontos felügyelt gépi tanulás sikeres felépítése, méretezése és telepítése Az adattudományi modell időt és technikai szakértelmet igényel egy magasan képzett adattudósok csoportjától. Ezenkívül az adatkutatónak újjá kell építenie a modelleket, hogy megbizonyosodjon arról, hogy a megadott felismerések igazak maradnak-e az adatok változásáig.
Ebben az oktatóanyagban megtanulja
- Mi az a felügyelt gépi tanulás?
- Mi az a felügyelet nélküli tanulás?
- Miért a felügyelt tanulás?
- Miért nem felügyelt tanulás?
- Hogyan működik a felügyelt tanulás?
- Hogyan működik a felügyelet nélküli tanulás?
- A felügyelt gépi tanulási technikák típusai
- A felügyelet nélküli gépi tanulási technikák típusai
- Felügyelt és felügyelet nélküli tanulás
Mi az a felügyelet nélküli tanulás?
A felügyelet nélküli tanulás egy gépi tanulási technika, ahol nincs szükség a modell felügyeletére. Ehelyett meg kell engednie, hogy a modell önállóan dolgozzon az információk felfedezéséhez. Főleg a címkézetlen adatokkal foglalkozik.
A felügyelet nélküli tanulási algoritmusok lehetővé teszik a felügyelt tanuláshoz képest összetettebb feldolgozási feladatok elvégzését. Bár a felügyelet nélküli tanulás kiszámíthatatlanabb lehet más természetes tanulási mély tanulási és megerősítő tanulási módszerekkel összehasonlítva.
Miért a felügyelt tanulás?
- A felügyelt tanulás lehetővé teszi, hogy adatokat gyűjtsön, vagy előállítson egy adatkimenetet a korábbi tapasztalatok alapján.
- Segít a teljesítmény kritériumok optimalizálásában a tapasztalatok felhasználásával
- A felügyelt gépi tanulás segít megoldani a különböző típusú valós számítási problémákat.
Miért nem felügyelt tanulás?
Itt vannak a legfőbb okok a felügyelet nélküli tanulás használatára:
- A felügyelet nélküli gépi tanulás mindenféle ismeretlen mintát talál az adatokban.
- A felügyelet nélküli módszerek segítenek megtalálni azokat a funkciókat, amelyek hasznosak lehetnek a kategorizáláshoz.
- Valós időben zajlik, így az összes bemeneti adatot elemezni és címkézni kell a tanulók jelenlétében.
- Könnyebb a címkézetlen adatok beszerzése a számítógépről, mint a címkézett adatok, amelyek manuális beavatkozást igényelnek.
Hogyan működik a felügyelt tanulás?
Például egy gépet szeretne képezni, amely segít megjósolni, hogy meddig tart hazafelé a munkahelyéről. Itt kezdje meg egy címkézett adatkészlet létrehozásával. Ezek az adatok tartalmazzák
- Időjárási viszonyok
- A nap időszaka
- Ünnepek
Ezek a részletek az Ön inputjai. A kimenet az az időtartam, amely az adott napon hazafelé tartott.
Ösztönösen tudod, hogy ha kint esik az eső, akkor tovább tart a hazautazás. De a gépnek adatokra és statisztikákra van szüksége.
Nézzük meg, hogyan fejleszthet egy felügyelt tanulási modellt ennek a példának, amely segít a felhasználónak meghatározni az ingázás idejét. Az első dolog, amire szükséged van, egy edzésadatkészlet. Ez az edzéskészlet tartalmazza az ingázás teljes idejét és a megfelelő tényezőket, például az időjárást, az időt stb. Ez az edzéskészlet alapján a gépe láthatja, hogy közvetlen összefüggés van az eső mennyisége és a hazaérkezéshez szükséges idő között.
Tehát megállapítja, hogy minél többet esik, annál tovább fog vezetni, hogy visszatérjen otthonába. Láthatja a kapcsolatot a munka elhagyása és az úton töltött idő között is.
Minél közelebb vagy 18 óráig, annál hosszabb idő telik el, mire hazaérsz. Előfordulhat, hogy a gép megtalálja a kapcsolatokat a címkézett adatokkal.
Ezzel kezdődik az adatmodell. Hatással van arra, hogy az eső hogyan befolyásolja az emberek vezetését. Azt is kezdi látni, hogy többen utaznak egy adott napszakban.
Hogyan működik a felügyelet nélküli tanulás?
Vegyük egy baba és a család kutyájának esetét.
Ismeri és azonosítja ezt a kutyát. Néhány héttel később egy családbarát hozza magával a kutyát, és megpróbál játszani a babával.
Baby nem látta korábban ezt a kutyát. De sok olyan tulajdonságot felismer (2 fül, szem, 4 lábon járás), mint a kedvtelésből tartott kutyája. Egy új állatot azonosít, mint egy kutyát. Ez a felügyelet nélküli tanulás, ahol nem tanítják, hanem megtanulják az adatokból (ebben az esetben a kutyára vonatkozó adatokból). Ha ez felügyelt tanulás lenne, a család barátja azt mondta volna a babának, hogy ez egy kutya.
A felügyelt gépi tanulási technikák típusai
Regresszió:
A regressziós technika egyetlen kimeneti értéket jósol meg edzésadatok felhasználásával.
Példa: A regresszió segítségével megjósolhatja a ház árát a képzési adatok alapján. A bemeneti változók a lokalitás, a ház mérete stb.
Osztályozás:
Az osztályozás a kimenet osztályon belüli csoportosítását jelenti. Ha az algoritmus két külön osztályba próbálja beírni a bemenetet, bináris osztályozásnak hívják. Több mint két osztály közötti választást többosztályos osztályozásnak nevezzük.
Példa : Annak meghatározása, hogy valaki lesz-e a hitel nemteljesítője.
Erősségek : A kimenetek mindig valószínűségi értelmezéssel rendelkeznek, és az algoritmus szabályozható a túlillesztés elkerülése érdekében.
Gyengeségek : A logisztikai regresszió alulteljesíthetõ, ha több vagy nem lineáris döntési határ van. Ez a módszer nem rugalmas, ezért nem ragadja meg a bonyolultabb kapcsolatokat.
A felügyelet nélküli gépi tanulási technikák típusai
A felügyelet nélküli tanulási problémák csoportosulási és társulási problémákra csoportosultak.
Csoportosítás
A klaszterezés fontos fogalom, ha a felügyelet nélküli tanulásról van szó. Főként egy struktúra vagy minta megkeresésével foglalkozik kategorizálatlan adatok gyűjteményében. A fürtözési algoritmusok feldolgozzák az adatait, és természetes fürtöket (csoportokat) keresnek, ha léteznek az adatokban. Azt is módosíthatja, hogy az algoritmusok hány klasztert azonosítsanak. Ez lehetővé teszi e csoportok részletességének beállítását.
Egyesület
Az asszociációs szabályok lehetővé teszik, hogy nagy adatbázisokban társításokat hozzon létre az adatobjektumok között. Ez a felügyelet nélküli technika a változók közötti izgalmas kapcsolatok felfedezéséről szól nagy adatbázisokban. Például azok, akik új otthont vásárolnak, nagy valószínűséggel vesznek új bútorokat.
Egyéb példák:
- A rákos betegek egy alcsoportja a génexpressziós mérések alapján csoportosítva
- Vásárlói csoportok böngészési és vásárlási előzményeik alapján
- Filmcsoport a filmnézők által adott minősítés alapján
Felügyelt és felügyelet nélküli tanulás
Paraméterek | Felügyelt gépi tanulási technika | Felügyelet nélküli gépi tanulási technika |
Folyamat | Felügyelt tanulási modellben bemeneti és kimeneti változókat adunk meg. | Felügyelet nélküli tanulási modellben csak bemenő adatokat adunk meg |
Beviteli adat | Az algoritmusokat címkézett adatok felhasználásával képzik ki. | Algoritmusokat használnak olyan adatokkal szemben, amelyek nincsenek felcímkézve |
Használt algoritmusok | Támogatja a vektorgépet, a neurális hálózatot, a lineáris és logisztikai regressziót, a véletlenszerű erdőt és az osztályozási fákat. | A felügyelet nélküli algoritmusok különféle kategóriákba sorolhatók: például klaszter algoritmusok, K-középértékek, hierarchikus fürtözés stb. |
Számítási komplexitás | A felügyelt tanulás egyszerűbb módszer. | A felügyelet nélküli tanulás számítási szempontból bonyolult |
Az adatok felhasználása | A felügyelt tanulási modell a képzési adatok felhasználásával megismeri a kapcsolatot az input és output között. | A felügyelet nélküli tanulás nem használja a kimeneti adatokat. |
Az eredmények pontossága | Nagyon pontos és megbízható módszer. | Kevésbé pontos és megbízható módszer. |
Valós idejű tanulás | A tanulási módszer offline állapotban zajlik. | A tanulási módszer valós időben zajlik. |
Osztályok száma | Az osztályok száma ismert. | Az osztályok száma nem ismert. |
Fő hátrány | A nagy adatok osztályozása igazi kihívást jelenthet a felügyelt tanulásban. | Nem lehet pontos információt szerezni az adatok rendezéséről, és a kimenet, mivel a felügyelet nélküli tanulásban használt adatok címkézve vannak és nem ismertek. |
Összegzés
- A felügyelt tanulás során a gépet jól "felcímkézett" adatok felhasználásával oktatja.
- A felügyelet nélküli tanulás egy gépi tanulási technika, ahol nincs szükség a modell felügyeletére.
- A felügyelt tanulás lehetővé teszi, hogy adatokat gyűjtsön, vagy előállítson egy adatkimenetet a korábbi tapasztalatok alapján.
- A felügyelet nélküli gépi tanulás segít mindenféle ismeretlen minta megtalálásában az adatokban.
- Például meghatározhatja a visszajutáshoz szükséges időt az időjárási viszonyok, a napszak és az ünnep alapján.
- Például a Baby a korábbi felügyelt tanulás alapján képes azonosítani más kutyákat.
- A regresszió és az osztályozás a felügyelt gépi tanulási technikák két típusa.
- A klaszterezés és a társulás a felügyelet nélküli tanulás két típusa.
- Felügyelt tanulási modellben az input és output változókat adják meg, míg a felügyelet nélküli tanulási modelleknél csak a bemeneti adatokat adják meg