Python oferă mai multe moduri de a descărca fișiere de pe internet. Acest lucru se poate face prin HTTP folosind pachetul urllib sau biblioteca de cereri. Acest tutorial va discuta cum să utilizați aceste biblioteci pentru a descărca fișiere din URL-uri folosind Python.
Biblioteca de solicitări este una dintre cele mai populare biblioteci din Python. Solicitările vă permit să trimiteți Solicitări HTTP / 1.1 fără a fi nevoie să adăugați manual șiruri de interogare către adresele URL sau să codificați datele POST.
Cu biblioteca de solicitări puteți efectua o mulțime de funcții, inclusiv:
Primul lucru pe care trebuie să-l faceți este să instalați biblioteca și este la fel de simplu:
cerințele de instalare pentru pip
Pentru a testa dacă instalarea a avut succes, puteți efectua un test foarte ușor în interpretul dvs. python prin tastarea pur și simplu:
cererile de import
Dacă instalarea a avut succes, nu vor exista erori.
Solicitările HTTP includ:
Efectuarea solicitărilor este foarte ușoară, după cum este ilustrat mai jos.
cereri de import req = requests.get ("http://www.google.com")
Comanda de mai sus va primi pagina web Google și va stoca informațiile înreq
variabil. Putem apoi să continuăm să obținem și alte atribute.
De exemplu, pentru a afla dacă reținerea paginii web Google a avut succes, vom interoga status_code.
cereri de import req = requests.get ("http://www.google.com") req.status_code 200 # 200 înseamnă o solicitare de succes
Ce se întâmplă dacă vrem să aflăm tipul de codare al paginii web Google?
codificarea codului ISO-8859-1
S-ar putea să doriți, de asemenea, să cunoașteți conținutul răspunsului.
req.text
Acesta este doar un conținut trunchiat al răspunsului.
'