Hogyan tölthet le & Telepítse az NLTK-t Windows / Mac rendszerre

Tartalomjegyzék:

Anonim

Ebben az oktatóanyagban megtudhatja -

  • Az NLTK telepítése a Windows rendszerbe
  • A Python telepítése a Windows rendszerbe
  • Az NLTK telepítése Mac / Linux rendszerre
  • Az NLTK telepítése az Anaconda segítségével
  • NLTK adatkészlet
  • Az NLTK összes csomagjának letöltése
  • Az NLP parancsfájl futtatása
  • Az NLTK parancsfájl futtatása

Az NLTK telepítése a Windows rendszerbe

Ebben a részben megtudhatjuk, hogyan lehet az NLTK-t beállítani a terminálon keresztül (Parancssor a Windows-ban).

Az alábbiakban megadott utasítás azon a feltételezésen alapul, hogy nincs telepítve python. Tehát az első lépés a python telepítése.

A Python telepítése a Windows rendszerbe:

1. lépés: Lépjen a https://www.python.org/downloads/ linkre , és válassza ki a Windows legújabb verzióját.

Megjegyzés : Ha nem szeretné letölteni a legújabb verziót, akkor látogasson el a letöltés fülre, és tekintse meg az összes kiadást.

2. lépés) Kattintson a letöltött fájlra

3. lépés: Válassza a Telepítés testreszabása lehetőséget

4. lépés) Kattintson a KÖVETKEZŐ gombra

5. lépés) A következő képernyőn

  1. Válassza ki a speciális beállításokat
  2. Adjon meg egy egyedi telepítési helyet. Az én esetemben a C meghajtón lévő mappát választjuk a működés megkönnyítése érdekében
  3. Kattintson a Telepítés gombra

6. lépés: Kattintson a Bezárás gombra, miután a telepítés megtörtént.

7. lépés: Másolja a Scripts mappa elérési útját.

8. lépés: A Windows parancssorában

  • Keresse meg a pip mappa helyét
  • Írja be az NLTK telepítéséhez a parancsot
    pip3 install nltk
  • A telepítést sikeresen kell végrehajtani

MEGJEGYZÉS : Python2 esetén használja a commandpip2 install nltk fájlt

9. lépés: A Windows Start menüjében keresse meg és nyissa meg a PythonShell alkalmazást

10. lépés: Ellenőrizheti, hogy a telepítés megfelelő-e az alábbi paranccsal

import nltk

Ha nem lát hibát, a telepítés befejeződött.

Az NLTK telepítése Mac / Linux rendszerre

Az NLTK Mac / Unix rendszerbe történő telepítéséhez python csomagkezelő pip szükséges az nltk telepítéséhez. Ha a pip nincs telepítve, kövesse az alábbi utasításokat a folyamat befejezéséhez

1. lépés: Frissítse a csomagindexet az alábbi parancs beírásával

sudo apt update

2. lépés. A pip telepítése a Python 3-hoz:

sudo apt install python3-pip

A pip telepíthető az easy_install segítségével is.

sudo apt-get install python-setuptools python-dev build-essential 

Most az easy_install telepítve van. A pip telepítéséhez futtassa az alábbi parancsot

sudo easy_install pip

3. lépés: Használja a következő parancsot az NLTK telepítéséhez

sudo pip install -U nltksudo pip3 install -U nltk

Az NLTK telepítése az Anaconda segítségével

1. lépés: Kérjük, telepítse az anacondát (amely különböző csomagok telepítésére is használható) a https://www.anaconda.com/products/individual webhelyen, és válassza ki, hogy melyik python verziót kell telepítenie az anaconda számára.

Megjegyzés: Az anaconda telepítésének részletes lépéseit lásd ebben az oktatóanyagban

2. lépés) Az Anaconda parancssorban

  1. Írja be a parancsot
    conda install -c anaconda nltk
  2. Tekintse át a csomagfrissítést, frissítse, telepítse az információkat, és írja be az igent
  3. Az NLTK letöltve és telepítve van

NLTK adatkészlet

Az NLTK modul számos elérhető adatkészlettel rendelkezik, amelyeket használatához le kell töltenie. Technikailag korpusznak hívják . Néhány példa stopszófájl , Gutenberg , framenet_v15 , large_grammars és így tovább.

Az NLTK összes csomagjának letöltése

1. lépés: Futtassa a Python tolmácsot Windows vagy Linux rendszeren

2. lépés)

  1. Írja be a parancsokat
import nltknltk.download ()
  1. Megnyílik az NLTK letöltött ablaka. Kattintson az Letöltés gombra az adatkészlet letöltéséhez. Ez a folyamat az internetkapcsolata alapján időt vesz igénybe

MEGJEGYZÉS: A letöltés helyét a Fájl> Letöltési könyvtár módosítása lehetőségre kattintva változtathatja meg

3. lépés: A telepített adatok teszteléséhez használja a következő kódot

>>> from nltk.corpus import brown>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'said',…]

Az NLP parancsfájl futtatása

Meg fogjuk vitatni, hogy az NLP szkript hogyan fog végrehajtódni a helyi számítógépünkön. A piacon számos, a természetes nyelv feldolgozására szolgáló könyvtár található. Tehát a könyvtár kiválasztása attól függ, hogy megfelel-e az Ön igényeinek. Itt található az NLP könyvtárak listája.

Az NLTK parancsfájl futtatása

1. lépés: A kedvenc kódszerkesztőben másolja a kódot, és mentse a fájlt " NLTKsample.py " néven

from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)

Kód Magyarázat:

  1. Ebben a programban az volt a cél, hogy minden típusú írásjelet eltávolítsunk az adott szövegből. Importáltuk a "RegexpTokenizer" -t, amely az NLTK modulja. Eltávolítja az összes kifejezést, szimbólumot, karaktert, számot vagy bármilyen dolgot, amit csak akar.
  2. Csak átadta a reguláris kifejezést a "RegexpTokenizer" modulnak.
  3. Továbbá a "tokenize" modullal kódoltuk a szót. A kimenetet a "filterdText" változó tárolja.
  4. És kinyomtatta őket a "print ()" használatával.

2. lépés) A parancssorban

  • Navigáljon arra a helyre, ahová a fájlt mentette
  • Futtassa a Python NLTKsample.py parancsot

Ez a kimenetet a következőképpen jeleníti meg:

["Hello", "Guru99", "You", "have", "build", "a", "very", "good", "site", "and", "I", "love", " látogatás ',' a ',' webhely ']