Mi az urllib?
Az urllib egy Python modul, amely URL-ek megnyitására használható. Meghatározza az URL-műveletekhez segítséget nyújtó függvényeket és osztályokat.
A Python segítségével az internetről is hozzáférhet és visszakereshet adatokat, például XML, HTML, JSON stb. A Python segítségével közvetlenül is dolgozhat ezekkel az adatokkal. Ebben az oktatóanyagban megnézzük, hogyan nyerhetünk adatokat az internetről. Például itt egy guru99 videó URL-t használtunk, és ehhez a videó URL-hez Python használatával fogunk hozzáférni, valamint kinyomtatni az URL HTML fájlját.
Ebben az oktatóanyagban megtanuljuk
- Az URL megnyitása az Urllib használatával
- Hogyan olvasható HTML fájl az URL-hez a Pythonban
Az URL megnyitása az Urllib használatával
Mielőtt futtatnánk a kódot az internetes adatokhoz való csatlakozáshoz, importálnunk kell egy nyilatkozatot az URL-könyvtár modulhoz vagy az "urllib" -hez.
- Import urllib
- Határozza meg a fő funkcióját
- Nyújtsa be a webUrl változót
- Ezután hívja meg az urlopen függvényt az URL lib könyvtárban
- Az URL, amelyet megnyitunk, a guru99 bemutató a youtube-on
- Ezután kinyomtatjuk az eredménykódot
- Az eredménykód lekérhető az általunk létrehozott webUrl változó getcode függvényének meghívásával
- Át kell alakítanunk egy karakterláncra, hogy összefűzhető legyen az "eredménykóddal"
- Ez egy szokásos "200" HTTP-kód lesz, ami azt jelzi, hogy a http-kérelmet sikeresen feldolgozták
Hogyan lehet HTML formátumú URL-t beszerezni a Pythonban
A HTML-fájlt a Python "olvasási funkciójának" használatával is elolvashatja, és a kód futtatásakor a HTML-fájl megjelenik a konzolon.
- Hívja meg az olvasási függvényt a webURL változóban
- A Read változó lehetővé teszi az adatfájlok tartalmának olvasását
- Olvassa el az URL teljes tartalmát egy adat nevű változóba
- Futtassa a kódot - Ez kinyomtatja az adatokat HTML formátumban
Itt van a teljes kód
Python 2 példa
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Python 3 példa
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)