Python Internet-hozzáférés az Urllib.Request és az urlopen () használatával

Tartalomjegyzék:

Anonim

Mi az urllib?

Az urllib egy Python modul, amely URL-ek megnyitására használható. Meghatározza az URL-műveletekhez segítséget nyújtó függvényeket és osztályokat.

A Python segítségével az internetről is hozzáférhet és visszakereshet adatokat, például XML, HTML, JSON stb. A Python segítségével közvetlenül is dolgozhat ezekkel az adatokkal. Ebben az oktatóanyagban megnézzük, hogyan nyerhetünk adatokat az internetről. Például itt egy guru99 videó URL-t használtunk, és ehhez a videó URL-hez Python használatával fogunk hozzáférni, valamint kinyomtatni az URL HTML fájlját.

Ebben az oktatóanyagban megtanuljuk

  • Az URL megnyitása az Urllib használatával
  • Hogyan olvasható HTML fájl az URL-hez a Pythonban

Az URL megnyitása az Urllib használatával

Mielőtt futtatnánk a kódot az internetes adatokhoz való csatlakozáshoz, importálnunk kell egy nyilatkozatot az URL-könyvtár modulhoz vagy az "urllib" -hez.

  • Import urllib
  • Határozza meg a fő funkcióját
  • Nyújtsa be a webUrl változót
  • Ezután hívja meg az urlopen függvényt az URL lib könyvtárban
  • Az URL, amelyet megnyitunk, a guru99 bemutató a youtube-on
  • Ezután kinyomtatjuk az eredménykódot
  • Az eredménykód lekérhető az általunk létrehozott webUrl változó getcode függvényének meghívásával
  • Át kell alakítanunk egy karakterláncra, hogy összefűzhető legyen az "eredménykóddal"
  • Ez egy szokásos "200" HTTP-kód lesz, ami azt jelzi, hogy a http-kérelmet sikeresen feldolgozták

Hogyan lehet HTML formátumú URL-t beszerezni a Pythonban

A HTML-fájlt a Python "olvasási funkciójának" használatával is elolvashatja, és a kód futtatásakor a HTML-fájl megjelenik a konzolon.

  • Hívja meg az olvasási függvényt a webURL változóban
  • A Read változó lehetővé teszi az adatfájlok tartalmának olvasását
  • Olvassa el az URL teljes tartalmát egy adat nevű változóba
  • Futtassa a kódot - Ez kinyomtatja az adatokat HTML formátumban

Itt van a teljes kód

Python 2 példa

## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()

Python 3 példa

## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)