Ebben az oktatóanyagban megtudhatja -
- Az NLTK telepítése a Windows rendszerbe
- A Python telepítése a Windows rendszerbe
- Az NLTK telepítése Mac / Linux rendszerre
- Az NLTK telepítése az Anaconda segítségével
- NLTK adatkészlet
- Az NLTK összes csomagjának letöltése
- Az NLP parancsfájl futtatása
- Az NLTK parancsfájl futtatása
Az NLTK telepítése a Windows rendszerbe
Ebben a részben megtudhatjuk, hogyan lehet az NLTK-t beállítani a terminálon keresztül (Parancssor a Windows-ban).
Az alábbiakban megadott utasítás azon a feltételezésen alapul, hogy nincs telepítve python. Tehát az első lépés a python telepítése.
A Python telepítése a Windows rendszerbe:
1. lépés: Lépjen a https://www.python.org/downloads/ linkre , és válassza ki a Windows legújabb verzióját.
Megjegyzés : Ha nem szeretné letölteni a legújabb verziót, akkor látogasson el a letöltés fülre, és tekintse meg az összes kiadást.
2. lépés) Kattintson a letöltött fájlra
3. lépés: Válassza a Telepítés testreszabása lehetőséget
4. lépés) Kattintson a KÖVETKEZŐ gombra
5. lépés) A következő képernyőn
- Válassza ki a speciális beállításokat
- Adjon meg egy egyedi telepítési helyet. Az én esetemben a C meghajtón lévő mappát választjuk a működés megkönnyítése érdekében
- Kattintson a Telepítés gombra
6. lépés: Kattintson a Bezárás gombra, miután a telepítés megtörtént.
7. lépés: Másolja a Scripts mappa elérési útját.
8. lépés: A Windows parancssorában
- Keresse meg a pip mappa helyét
- Írja be az NLTK telepítéséhez a parancsot
pip3 install nltk
- A telepítést sikeresen kell végrehajtani
MEGJEGYZÉS : Python2 esetén használja a commandpip2 install nltk fájlt
9. lépés: A Windows Start menüjében keresse meg és nyissa meg a PythonShell alkalmazást
10. lépés: Ellenőrizheti, hogy a telepítés megfelelő-e az alábbi paranccsal
import nltk
Ha nem lát hibát, a telepítés befejeződött.
Az NLTK telepítése Mac / Linux rendszerre
Az NLTK Mac / Unix rendszerbe történő telepítéséhez python csomagkezelő pip szükséges az nltk telepítéséhez. Ha a pip nincs telepítve, kövesse az alábbi utasításokat a folyamat befejezéséhez
1. lépés: Frissítse a csomagindexet az alábbi parancs beírásával
sudo apt update
2. lépés. A pip telepítése a Python 3-hoz:
sudo apt install python3-pip
A pip telepíthető az easy_install segítségével is.
sudo apt-get install python-setuptools python-dev build-essential
Most az easy_install telepítve van. A pip telepítéséhez futtassa az alábbi parancsot
sudo easy_install pip
3. lépés: Használja a következő parancsot az NLTK telepítéséhez
sudo pip install -U nltksudo pip3 install -U nltk
Az NLTK telepítése az Anaconda segítségével
1. lépés: Kérjük, telepítse az anacondát (amely különböző csomagok telepítésére is használható) a https://www.anaconda.com/products/individual webhelyen, és válassza ki, hogy melyik python verziót kell telepítenie az anaconda számára.
Megjegyzés: Az anaconda telepítésének részletes lépéseit lásd ebben az oktatóanyagban
2. lépés) Az Anaconda parancssorban
- Írja be a parancsot
conda install -c anaconda nltk
- Tekintse át a csomagfrissítést, frissítse, telepítse az információkat, és írja be az igent
- Az NLTK letöltve és telepítve van
NLTK adatkészlet
Az NLTK modul számos elérhető adatkészlettel rendelkezik, amelyeket használatához le kell töltenie. Technikailag korpusznak hívják . Néhány példa stopszófájl , Gutenberg , framenet_v15 , large_grammars és így tovább.
Az NLTK összes csomagjának letöltése
1. lépés: Futtassa a Python tolmácsot Windows vagy Linux rendszeren
2. lépés)
- Írja be a parancsokat
import nltknltk.download ()
- Megnyílik az NLTK letöltött ablaka. Kattintson az Letöltés gombra az adatkészlet letöltéséhez. Ez a folyamat az internetkapcsolata alapján időt vesz igénybe
MEGJEGYZÉS: A letöltés helyét a Fájl> Letöltési könyvtár módosítása lehetőségre kattintva változtathatja meg
3. lépés: A telepített adatok teszteléséhez használja a következő kódot
>>> from nltk.corpus import brown>>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said',…]
Az NLP parancsfájl futtatása
Meg fogjuk vitatni, hogy az NLP szkript hogyan fog végrehajtódni a helyi számítógépünkön. A piacon számos, a természetes nyelv feldolgozására szolgáló könyvtár található. Tehát a könyvtár kiválasztása attól függ, hogy megfelel-e az Ön igényeinek. Itt található az NLP könyvtárak listája.
Az NLTK parancsfájl futtatása
1. lépés: A kedvenc kódszerkesztőben másolja a kódot, és mentse a fájlt " NLTKsample.py " néven
from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)
Kód Magyarázat:
- Ebben a programban az volt a cél, hogy minden típusú írásjelet eltávolítsunk az adott szövegből. Importáltuk a "RegexpTokenizer" -t, amely az NLTK modulja. Eltávolítja az összes kifejezést, szimbólumot, karaktert, számot vagy bármilyen dolgot, amit csak akar.
- Csak átadta a reguláris kifejezést a "RegexpTokenizer" modulnak.
- Továbbá a "tokenize" modullal kódoltuk a szót. A kimenetet a "filterdText" változó tárolja.
- És kinyomtatta őket a "print ()" használatával.
2. lépés) A parancssorban
- Navigáljon arra a helyre, ahová a fájlt mentette
- Futtassa a Python NLTKsample.py parancsot
Ez a kimenetet a következőképpen jeleníti meg:
["Hello", "Guru99", "You", "have", "build", "a", "very", "good", "site", "and", "I", "love", " látogatás ',' a ',' webhely ']