文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽：166日期：2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數據

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調了 js里的 click() 方法,并沒有觸發 target 怎么辦3)我不知道是先渲染page_source, 還是應該先 click, 假設執行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1：

說的是什么意思？百思不得其解啊。。。

selenium自動化，click能模仿用戶點擊，就跟你自己在頁面上點擊一樣，一切都在虛擬瀏覽器驅動中進行。

看你的業務邏輯啊。。。比如有些數據要點擊后才有，那就先click再獲取源代碼。

Python 編程

上一條：Python從URL中提取域名下一條：python - sklearn如何訓練大規模數據集

相關文章：

1. mac里的docker如何命令行開啟呢？2. 如何解決docker宿主機無法訪問容器中的服務？3. 韋小寶老師的TP基礎實戰教學4. node.js - 在vuejs-templates/webpack中dev-server.js里為什么要exports readyPromise?5. javascript - 手賤把桌面git init了，請問如何撤回6. javascript - js 有優雅的辦法從外部 hijack 函數入參嗎？7. angular.js - 百度爬蟲如何處理“#”符號？8. css3動畫 - css3 animation初始動畫卡頓是怎么回事？9. Java在半透明框架/面板/組件上重新繪畫。10. html - css3中多列高度統一

排行榜

					
					mac里的docker如何命令行開啟呢？
如何解決docker宿主機無法訪問容器中的服務？
docker綁定了nginx端口 外部訪問不到
dockerfile - 我用docker build的時候出現下邊問題  麻煩幫我看一下
css3動畫 - css3 animation初始動畫卡頓是怎么回事？
Java在半透明框架/面板/組件上重新繪畫。
angular.js - 百度爬蟲如何處理“#”符號？
韋小寶老師的TP基礎實戰教學
javascript - js 有優雅的辦法從外部 hijack 函數入參嗎？
javascript - 手賤把桌面git init了，請問如何撤回
node.js - 在vuejs-templates/webpack中dev-server.js里為什么要exports readyPromise?
				

熱門標簽

久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

selenium - 請教一下 Python 爬蟲工具