python中requests模擬登錄的三種方式(攜帶cookie/session進(jìn)行請(qǐng)求網(wǎng)站)
一,cookie和session的區(qū)別
cookie在客戶的瀏覽器上,session存在服務(wù)器上cookie是不安全的,且有失效時(shí)間session是在cookie的基礎(chǔ)上,服務(wù)端設(shè)置session時(shí)會(huì)向?yàn)g覽器發(fā)送設(shè)置一個(gè)設(shè)置cookie的請(qǐng)求,這個(gè)cookie包括session的id當(dāng)訪問服務(wù)端時(shí)帶上這個(gè)session_id就可以獲取到用戶保存在服務(wù)端對(duì)應(yīng)的session
二,爬蟲處理cookie和session
帶上cookie和session的好處:能夠請(qǐng)求到登錄后的界面
帶上cookie和session的弊端:一個(gè)cookie和session往往和一個(gè)用戶對(duì)應(yīng),訪問太快容易被服務(wù)器檢測(cè)出來爬蟲
不需要cookie的時(shí)候盡量不要用
三,處理session,cookie請(qǐng)求
1,cookie請(qǐng)求方式
1.1 直接使用瀏覽器抓包到的現(xiàn)有的cookie進(jìn)行訪問網(wǎng)站: 放在header字典里面
header={'User-Agent':'Mozilla/5.0 (X11; Ubuntu; Linu…) Gecko/20100101 Firefox/64.0','Cookie':'csrftoken=JfnuMOvgMGZTxtCjvgfZ…6246vb2; username=chengyangkj',}r=request.get(url,headers=header)
當(dāng)然也可以在發(fā)送get請(qǐng)求時(shí)加上cookies的字典參數(shù):
Cookie='csrftoken=JfnuMOvgMGZTxtCjvgfZ…6246vb2; username=chengyangkj'
但是接受的參數(shù)是字典類型的,這就需要我們適用字符串分割方法把cookie字符串轉(zhuǎn)為字典形式:
Cookie='csrftoken=JfnuMOvgMGZTxtCjvgfZ…6246vb2; username=chengyangkj'cookies={i.split('=')[1]:i.split('=')[1] for i in Cookie.split('; ')} #先使用for循環(huán)遍歷Cookie以”; “(分號(hào)和空格)分開的列表 再分別獲取i以等號(hào)分割的列表的[0] [1] 位置填入 字典鍵 和值的位置r=request.get(url,headers=header,cookies=cookies)
適用于cookie過期時(shí)間比較長(zhǎng)的網(wǎng)站
2.session請(qǐng)求方式request提供了一個(gè)一個(gè)叫做session的類,來實(shí)現(xiàn)客戶端和服務(wù)端的會(huì)話保持 使用方法:1.實(shí)例化一個(gè)session對(duì)象2.讓session發(fā)送get或post請(qǐng)求3.再使用session訪問只有登錄之后才能訪問的網(wǎng)站,這時(shí)候session會(huì)自動(dòng)帶上服務(wù)器保存在其中的信息進(jìn)行訪問
session=request.session() #實(shí)例化session對(duì)象response=session.get(url,header) #使用session對(duì)象發(fā)送get請(qǐng)求 就能獲取服務(wù)端設(shè)置的session對(duì)象
到此這篇關(guān)于python中requests模擬登錄的三種方式(攜帶cookie/session進(jìn)行請(qǐng)求網(wǎng)站)的文章就介紹到這了,更多相關(guān)python requests模擬登錄 內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
