久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

您的位置:首頁技術文章
文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽:135日期:2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數據

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調了 js里的 click() 方法,并沒有觸發 target 怎么辦3)我不知道是先渲染page_source, 還是 應該先 click, 假設執行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1:

說的是什么意思?百思不得其解啊。。。

selenium自動化,click能模仿用戶點擊,就跟你自己在頁面上點擊一樣,一切都在虛擬瀏覽器驅動中進行。

看你的業務邏輯啊。。。比如有些數據要點擊后才有,那就先click再獲取源代碼。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 国产精品高潮呻吟久久av野狼 | 亚洲精品夜夜夜 | 久久久精品网站 | 精品国产一区二区三区久久久蜜臀 | 91久久精品一区 | 亚洲色域网| 久久国产精品视频 | 亚洲va中文字幕 | 亚洲国产一区视频 | 久草视频在线播放 | 国产成人免费视频网站高清观看视频 | 久久人| 91亚洲国产成人精品性色 | 国产免费高清 | 嫩草影院网站入口 | 精品久久久久久久久久久久 | 四虎av| 久久久久久精 | 中文乱码一区 | 精品免费国产一区二区三区 | 国产日韩欧美激情 | 久久久久国产精品 | 亚洲一区二区三区在线 | 看毛片网站 | 国产乱码精品一区二区三区忘忧草 | 有码在线| 99免费观看 | 中文字幕日韩在线视频 | 毛片在线免费播放 | 九色91视频 | 亚洲精品一区二区三区蜜桃下载 | 欧美精品国产精品 | 亚洲成人免费视频在线观看 | 在线欧美亚洲 | 99成人| 亚洲精品电影网在线观看 | 在线二区| 欧洲精品视频在线观看 | 91麻豆精品国产91久久久久久久久 | 日日骚视频 | 亚洲高清网 |