Zavarzási mátrix a gépi tanulásban, PÉLDA

Tartalomjegyzék:

Anonim

Mi az a zavartsági mátrix?

A zavaros mátrix egy teljesítménymérési technika a gépi tanulás osztályozásához. Ez egyfajta táblázat, amely segít megismerni az osztályozási modell teljesítményét egy vizsgálati adatkészleten, hogy a valódi értékek ismertek legyenek. Maga a zavaros mátrix kifejezés nagyon egyszerű, de a hozzá kapcsolódó terminológia kissé zavaró lehet. Itt néhány egyszerű magyarázatot adunk erre a technikára.

Ebben az oktatóanyagban megtanulod,

  • Mi az a zavartsági mátrix?
  • A zavartsági mátrix négy eredménye
  • Példa a zavaros mátrixra:
  • Hogyan kell kiszámítani a zavartsági mátrixot
  • Egyéb fontos kifejezések a Confusion mátrix használatával
  • Miért van szükség a Confusion mátrixra?

A zavartsági mátrix négy eredménye

A zavaros mátrix a tényleges és a megjósolt osztályok összehasonlításával vizualizálja az osztályozó pontosságát. A bináris zavaros mátrix négyzetekből áll:

Zavarzótábla
  • TP: Igaz pozitív: Az előrejelzett értékek helyesen jósolták meg tényleges pozitívnak
  • FP: Az előrejelzett értékek helytelenül jósolták meg a tényleges pozitív értéket. azaz pozitívnak jósolt negatív értékek
  • FN: hamis negatív: negatívnak jósolt pozitív értékek
  • TN: Igaz negatív: Az előrejelzett értékek helyesen jósolták tényleges negatívnak

A pontossági tesztet a zavaros mátrixból számíthatja ki :

Példa a zavartsági mátrixra:

A Confusion Matrix egy hasznos gépi tanulási módszer, amely lehetővé teszi a visszahívás, a pontosság, a pontosság és az AUC-ROC görbe mérését. Az alábbiakban bemutatunk egy példát az igaz pozitív, igaz negatív, hamis negatív és igaz negatív kifejezések ismeretére.

Igaz pozitív:

Ön pozitívnak vetítette előre, és kiderül, hogy igaz. Például azt jósoltad, hogy Franciaország megnyeri a világkupát, és ő nyert.

Igaz negatív:

Amikor negatívat jósolt, és ez igaz. Azt jósoltad, hogy Anglia nem nyer, és veszít.

Álpozitív:

Jóslata pozitív és hamis.

Azt jósoltad, hogy Anglia nyer, de veszített.

Hamis negatív:

Előrejelzése negatív, és eredménye hamis is.

Azt jósoltad, hogy Franciaország nem nyer, de nyert.

Ne feledje, hogy az előrejelzett értékeket igaznak vagy hamisnak, vagy pozitívnak és negatívnak írjuk le.

Hogyan kell kiszámítani a zavartsági mátrixot

Itt lépésről lépésre számolják a zavaros mátrixot az adatbányászatban

  • 1. lépés: Először tesztelnie kell az adatkészletet a várható eredményértékekkel.
  • 2. lépés: Megjósolja a tesztadatkészlet összes sorát.
  • 3. lépés: Számítsa ki a várható jóslatokat és eredményeket:
  1. Az összes osztály jó előrejelzése.
  2. Az egyes osztályok téves jóslatainak összessége.

Ezt követően ezek a számok az alább megadott módszerekkel vannak rendezve:

  • A mátrix minden sora egy jósolt osztályhoz kapcsolódik.
  • A mátrix minden oszlopa megfelel egy tényleges osztálynak.
  • A helyes és helytelen osztályozás összesített számát beírjuk a táblázatba.
  • Az osztályra vonatkozó jó előrejelzések összege kerül az előrejelzett oszlopba és az adott osztály várható sorába.
  • Egy osztályra vonatkozó helytelen előrejelzések összege az adott osztály értékének várható sorába és az adott osztály értékének előre jelzett oszlopába kerül.

Egyéb fontos kifejezések a Confusion mátrix használatával

  • Pozitív prediktív érték (PVV): Ez nagyon közel van a pontossághoz. Az egyik jelentős különbség a két táv között az, hogy a PVV figyelembe veszi a prevalenciát. Abban a helyzetben, amikor az osztályok tökéletesen kiegyensúlyozottak, a pozitív prediktív érték megegyezik a pontossággal.
  • Null hibaarány: Ez a kifejezés arra szolgál, hogy meghatározza, hányszor téves az előrejelzés, ha meg tudja jósolni a többségi osztályt. Osztályozójának összehasonlításához alapmutatónak tekintheti.
  • F pontszám: Az F1 pontszám a valódi pozitív (visszahívás) és pontosság súlyozott átlaga.
  • Roc görbe: A Roc görbe a valódi pozitív arányokat mutatja a hamis pozitív arányhoz képest különböző vágási pontokon. Ez egyúttal kompromisszumot is mutat az érzékenység (visszahívás és specifitás vagy a valódi negatív ráta) között.
  • Pontosság: A precíziós mutató a pozitív osztály pontosságát mutatja. Azt méri, hogy a pozitív osztály előrejelzése mennyire valószínű a helyes.

A maximális pontszám 1, ha az osztályozó tökéletesen osztályozza az összes pozitív értéket. Önmagában a precizitás nem túl hasznos, mert figyelmen kívül hagyja a negatív osztályt. A mutató általában párosul a Visszahívás mutatóval. A visszahívást érzékenységnek vagy valódi pozitív aránynak is nevezik.

  • Érzékenység : Az érzékenység kiszámítja a helyesen észlelt pozitív osztályok arányát. Ez a mutató azt mutatja meg, hogy a modell mennyire képes felismerni egy pozitív osztályt.

Miért van szükség a Confusion mátrixra?

Íme a zavartsági mátrix használatának előnyei / előnyei.

  • Megmutatja, hogyan keveredik össze bármely osztályozási modell, amikor előrejelzéseket készít.
  • A zavaros mátrix nemcsak betekintést nyújt az osztályozó által elkövetett hibákba, hanem a hibák típusaiba is.
  • Ez a bontás segít leküzdeni a korlátozást, amely önmagában az osztályozási pontosság használatára vonatkozik.
  • A zavaros mátrix minden oszlopa az előrejelzett osztály példányait ábrázolja.
  • A zavaros mátrix minden sora a tényleges osztály példányait reprezentálja.
  • Betekintést nyújt nemcsak az osztályozó által elkövetett hibákba, hanem az elkövetett hibákba is.