站長資訊網
最全最豐富的資訊網站

詳解Python之urllib爬蟲、request模塊和parse模塊

詳解Python之urllib爬蟲、request模塊和parse模塊

文章目錄

  • urllib
  • request模塊
    • 訪問URL
    • Request類
    • 其他類
  • parse模塊
    • 解析URL
    • 轉義URL
  • robots.txt文件

(免費學習推薦:python視頻教程

urllib


urllib是Python中用來處理URL的工具包,源碼位于/Lib/下。它包含了幾個模塊:用于打開及讀寫的urls的request模塊、由request模塊引起異常的error模塊、用于解析urls的parse模塊、用于響應處理的response模塊、分析robots.txt文件的robotparser模塊。

注意版本差異。urllib有3個版本:Python2.X包含urlliburllib2模塊,Python3.X把urlliburllib2以及urlparse合成到urllib包中,而urllib3是新增的第三方工具包。若遇到"No module named urllib2"等問題幾乎都是Python版本不同導致的。

urllib3是一個功能強大、條例清晰、用于HTTP客戶端的Python庫。它提供了許多Python標準庫里所沒有的特性:壓縮編碼、連接池、線程安全、SSL/TLS驗證、HTTP和SCOCKS代理等。可以通過pip進行安裝:pip install urllib3
詳解Python之urllib爬蟲、request模塊和parse模塊
也可以通過GitHub下載最新代碼:

git clone git://github.com/shazow/urllib3.git python setup.py install

urllib3參考文檔:https://urllib3.readthedocs.io/en/latest/

request模塊


urllib.request模塊定義了身份認證、重定向、cookies等應用中打開url的函數和類。

再簡單介紹下request包,該包用于高級的非底層的HTTP客戶端接口,容錯能力比request模塊強大。request使用的是urllib3,它繼承了urllib2的特性,支持HTTP連接保持和連接池,支持使用cookie保持會話、文件上傳、自動解壓縮、Unicode響應、HTTP(S)代理等。

贊(0)
分享到: 更多 (0)
網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
精品国内在视频线2019| 久久99国产精品久久99| 尤物在线观看精品国产福利片| 182tv精品视频在线播放| 国产精品对白交换视频| 香蕉久久综合精品首页| 国产精品高清2021在线 | 日韩一区二区在线免费观看| 日韩久久精品一区二区三区| 伊人久久精品无码麻豆一区| 久久精品国产99久久久古代 | 99任你躁精品视频| 精品无码一区二区三区爱欲九九| 亚洲av永久无码精品网站| 伊人久久精品无码二区麻豆| 久久久精品久久久久久| 亚洲无码日韩精品第一页| 日韩a级毛片免费观看| 伊人影视在线观看日韩区| 国产中的精品一区的| 国产亚洲精品美女久久久久 | 亚洲依依成人精品| 青青青国产精品一区二区| 久久99国产精品视频| 午夜精品久视频在线观看| 亚洲综合一区二区精品导航| 亚洲精品123区在线观看| 最新国产精品好看的国产精品| 国产精品自在拍在线拍| 亚洲精品第一综合99久久| 2017国产精品自拍| 国产精品女主播自在线拍| 日韩免费精品视频| 思思久久好好热精品国产| 2021最新久久久视精品爱| 2020久久精品国产免费| 久久亚洲精品国产亚洲老地址 | 亚洲国产午夜中文字幕精品黄网站| 无码8090精品久久一区| selaoban在线视频免费精品| 国产精品午夜久久|