文章詳情頁

PC端訪問卻變成移動端地址問題#python#scrapy

瀏覽：153日期：2022-06-27 08:35:16

問題描述

用scrapy 爬取喜馬拉雅，爬取PC端地址，入口鏈接的response沒問題，但后面response看到的是移動端地址。。。。

spider 代碼如下：

class SpxmlySpider(scrapy.Spider): name = ’ximalaya’ allowed_domains = ['ximalaya.com'] # 保存每頁鏈接 start_urls = [’http://www.ximalaya.com/dq/all/{}’.format(num) for num in range(2, 3)] #先改為第二頁試試 def parse(self, response):# 取出專輯鏈接print(response)mainurls = response.xpath(’//p[@class='albumfaceOutter']/a/@href’).extract()# for url in mainurls:# yield Request(url = url, callback=self.parse_details)print(mainurls[0])yield Request(url = mainurls[0], dont_filter=True, callback = self.parse_details)# TODO 為什么PC端訪問會變成移動地址問題！！！！！！！！！！！！！！！！！ def parse_details(self, response):item = XimalayaItem()print(response)......以下省略

控制臺輸出：

PC端訪問卻變成移動端地址問題#python#scrapy

已經寫了一個 middlewares.RotateUserAgentMiddleware，是生效的，輸出內容也可以看出來。

是不是觸發什么反爬機制？

問題解答

回答1：

應該是你的headers沒有設置user-agent的原因

回答2：

request headers 好好配置一下, 判斷是不是移動端一般是靠user-agent啥都沒有也能訪問到數據，也說明目標網站沒怎么在意防盜鏈

Python 編程

上一條：python - Django操作數據庫遇到問題，無法查詢更新后的數據下一條：python - scrapy抓取知網response的內容重復

相關文章：

1. javascript - 微信報redirect_uri參數錯誤2. 我在centos容器里安裝docker，也就是在容器里安裝容器，報錯了？3. android - 類似微信朋友圈或者QQ空間說說那種點擊圖片放大，并且有放大縮小手勢，左右滑動圖片手勢效果4. java - 初學SSM 在import自己寫的包下的類的時候飄紅，求大神解答？5. 網頁動畫等過渡效果，CSS3 transitions 和 jQuery animations 誰實現的性能更好？6. javascript - 怎么簡寫這段jQuery功能？7. springboot中不能獲取post請求參數的解決方法8. javascript - 如何計算字符串寬度？9. java - Atom中文問題10. angular.js - angular中的a標簽不起作用

排行榜

					
					javascript - 微信報redirect_uri參數錯誤
我在centos容器里安裝docker，也就是在容器里安裝容器，報錯了？
android - 類似微信朋友圈或者QQ空間說說那種點擊圖片放大，并且有放大縮小手勢，左右滑動圖片手勢效果
angular.js - angular中的a標簽不起作用
springboot中不能獲取post請求參數的解決方法
java - 初學SSM 在import自己寫的包下的類的時候飄紅，求大神解答？
javascript - 如何計算字符串寬度？
網頁動畫等過渡效果，CSS3 transitions 和 jQuery animations 誰實現的性能更好？
java - Atom中文問題
javascript - 怎么簡寫這段jQuery功能？
win10系統 php安裝swoole擴展
				

熱門標簽

久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

PC端訪問卻變成移動端地址問題#python#scrapy