文章詳情頁

html - Python爬蟲，翻頁數(shù)據(jù)怎么爬，URL不變

瀏覽：140日期：2022-08-09 14:14:12

問題描述

網(wǎng)址：http://quote.eastmoney.com/ce...我想爬所有頁的名稱數(shù)據(jù)，（這里只有兩頁），判斷有沒有下一頁的條件該怎么寫呢？代碼：

from selenium import webdriverdriver=webdriver.PhantomJS()url=’http://quote.eastmoney.com/center/list.html#28003684_0_2’driver.get(url)usoup = BeautifulSoup(driver.page_source, ’xml’)n=[]while True: t=usoup.find(’table’,{’id’:’fixed’}) utable=t.find_all(’a’,{’target’:’_blank’}) for i in range(len(utable)): if i % 6 ==1: n.append(utable[i].text) if #停止條件怎么寫: break driver.find_element_by_xpath(r’//*@id='pagenav']/a[2]’).click() usoup = BeautifulSoup(driver.page_source, ’xml’)

后面這里就不會寫了。。。

問題解答

回答1：

可以判斷每一頁的條目，每一頁共20條，如果當(dāng)前頁不足20條的時候，說明此頁是最后一頁了，爬完當(dāng)前頁就該停止了

回答2：

話說這個表格不是都有個jsonp的返回接口嗎？為什么還要爬？

回答3：

走的就是jsonp接口，直接拿就好了。

非要抓取的話，只能用selenium + phantomjs 之類的模擬頁面去獲取了。

回答4：

http://nufm.dfcfw.com/EM_Fina...{rank:[(x)],pages:(pc)}&token=7bc05d0d4c3c22ef9fca8c2a912d779c&jsName=quote_123&_g=0.5385195357178545

Python 編程

上一條：python - Django ManyToManyField 字段數(shù)據(jù)在 admin后臺顯示不正確，這是怎么回事？下一條：python - pyspider 如何獲取某個列表中的第n個元素

排行榜

					
					如何解決Centos下Docker服務(wù)啟動無響應(yīng)，且輸入docker命令無響應(yīng)？
我在centos容器里安裝docker，也就是在容器里安裝容器，報錯了？
怎么用 css3實現(xiàn)波浪底紋效果？
微信小程序session無法緩存的問題
vue.js - 關(guān)于Vue-cli項目在VPS中用Nginx部署完請求頁面app.js找不到提示404錯誤。
docker 17.03 怎么配置 registry mirror ?
mysqld無法關(guān)閉
javascript - 七牛接口如何在前端調(diào)用？
Java OutputStream等效于getClass（）。getClassLoader（）。getResourceAsStream（）
html - 這種錯位的時間軸怎么布局，然后用css實現(xiàn)？
基于Nginx的Wordpress安裝失敗?
				

熱門標(biāo)簽

久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

html - Python爬蟲，翻頁數(shù)據(jù)怎么爬，URL不變