文章詳情頁
python - 為什么感覺 pyspider 爬取的速度好慢
瀏覽:123日期:2022-08-08 09:43:03
問題描述
為什么感覺 pyspider 爬取的速度好慢(比自己直接用 requests 和 bs慢多了),是不是因為有些網(wǎng)頁會 retry,不過成功率倒是比自己爬取的高多了。是不是我的使用方法不對?求解釋
問題解答
回答1:這里可以設置 web ui 控制臺上的 rate/burst 參數(shù)來調節(jié)速度,rate 是 每秒抓取的數(shù)量,burst 是并發(fā)的數(shù)量,默認是 1/3 所以比較慢,還是對這個工具了解不夠呀
回答2:我沒有用過框架來寫爬蟲,但是我在自己寫爬蟲的時候,并發(fā)寫起來,模型越復雜(如線程控制,線程狀態(tài)監(jiān)控),效率是越低的。
相關文章:
1. HTML5不支持frameset一般怎么解決?2. javascript - Vue的計算屬性底層依賴原理是怎么樣?3. javascript - jquery怎么給select option一個點擊時觸發(fā)的事件,如圖 如果選擇自定義觸發(fā)一個時間?4. 網(wǎng)頁爬蟲 - python爬蟲用BeautifulSoup爬取<s>元素并寫入字典,但某些div下沒有這一元素,導致自動寫入下一條,如何解決?5. 百度地圖api - Android百度地圖SDK,MapView上層按鈕可見卻不可觸,怎么解決?6. mysql 獲取時間函數(shù)unix_timestamp 問題?7. html5 - canvas中的mousedrag事件,為什么鼠標拖出canvas,然后再次移入canvas,drag事件還觸發(fā)8. 新入手layuiadmin,部署到tp中。想用php自已寫一個后臺管理系統(tǒng)。9. javascript - react 組件 使用super()報錯10. javascript - es6擴展運算符...的問題
排行榜

熱門標簽