文章詳情頁(yè)

Python爬蟲如何爬取span和span中間的內(nèi)容并分別存入字典里？

瀏覽：163日期：2022-07-15 16:32:54

問題描述

我想把房屋概況分別抓出來(lái)并分別作為獨(dú)立的列存儲(chǔ)進(jìn)字典里，但是行內(nèi)元素沒有辦法直接用for循環(huán)摳出來(lái)。這是我的代碼：

soup.select(’.house-info li’)[1].text.strip()

這是網(wǎng)頁(yè)html代碼：

問題解答

回答1：

其實(shí)還是很有簡(jiǎn)單的，你看這個(gè)還是有規(guī)律的，規(guī)律在于有分隔符|，我寫了個(gè)DEMO

通過get_text()得到內(nèi)在所有內(nèi)容，然后去除空格。后面你就用split進(jìn)行分割吧，后面的不寫了。如果有問題再交流。

回答2：我感覺這個(gè)html代碼寫錯(cuò)了呢,標(biāo)簽的內(nèi)容文本在標(biāo)簽外面

Python爬蟲如何爬取span和span中間的內(nèi)容并分別存入字典里？

正確的標(biāo)簽內(nèi)容就兩個(gè):

房屋概況：

46m2

回答3：

innerText

回答4：

你這種情況，我覺得用 for 循環(huán)加上正則表達(dá)式是最方便的，如果所有模版都是這樣固定的話

回答5：

用pyquery吧

from pyquery import PyQuery as Q

Q(text).find(’.house-info li’).text()

Python 編程

上一條：python文檔怎么查看？下一條：python class嵌套怎么訪問父類

相關(guān)文章：

1. docker網(wǎng)絡(luò)端口映射，沒有方便點(diǎn)的操作方法么？2. docker start -a dockername 老是卡住，什么情況？3. docker images顯示的鏡像過多，狗眼被亮瞎了，怎么辦？4. docker gitlab 如何git clone？5. dockerfile - [docker build image失敗- npm install]6. docker不顯示端口映射呢？7. docker-compose 為何找不到配置文件？8. 對(duì)html實(shí)現(xiàn)監(jiān)測(cè) 發(fā)現(xiàn)不對(duì)9. 前端 - 使用css畫一個(gè)矩形？10. html - 誰(shuí)能解釋這個(gè)現(xiàn)象？？

排行榜

					
					docker網(wǎng)絡(luò)端口映射，沒有方便點(diǎn)的操作方法么？
docker start -a dockername 老是卡住，什么情況？
docker images顯示的鏡像過多，狗眼被亮瞎了，怎么辦？
docker gitlab 如何git clone？
dockerfile - [docker build image失敗- npm install]
docker不顯示端口映射呢？
docker-compose 為何找不到配置文件？
JavaScript如何循序漸進(jìn)，有效的學(xué)習(xí)？看不下去怎么辦？
html - form 表單 用戶名提示和錯(cuò)誤提示分開顯示？
前端 - 使用css畫一個(gè)矩形？
對(duì)html實(shí)現(xiàn)監(jiān)測(cè)  發(fā)現(xiàn)不對(duì)
				

熱門標(biāo)簽

久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

Python爬蟲如何爬取span和span中間的內(nèi)容并分別存入字典里？