久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

您的位置:首頁技術文章
文章詳情頁

python爬取鏈家二手房的數據

瀏覽:37日期:2022-06-18 17:08:08
目錄一、查找數據所在位置:二、確定數據存放位置:三、獲取html數據:四、解析html,提取有用數據:一、查找數據所在位置:

打開鏈家官網,進入二手房頁面,選取某個城市,可以看到該城市房源總數以及房源列表數據。

python爬取鏈家二手房的數據

二、確定數據存放位置:

某些網站的數據是存放在html中,而有些卻api接口,甚至有些加密在js中,還好鏈家的房源數據是存放到html中:

python爬取鏈家二手房的數據

三、獲取html數據:

通過requests請求頁面,獲取每頁的html數據

# 爬取的url,默認爬取的南京的鏈家房產信息url = ’https://nj.lianjia.com/ershoufang/pg{}/’.format(page)# 請求urlresp = requests.get(url, headers=headers, timeout=10)四、解析html,提取有用數據:

通過BeautifulSoup解析html,并提取相應有用的數據

soup = BeautifulSoup(resp.content, ’lxml’)# 篩選全部的li標簽sellListContent = soup.select(’.sellListContent li.LOGCLICKDATA’)# 循環遍歷for sell in sellListContent: # 標題 title = sell.select(’div.title a’)[0].string # 先抓取全部的div信息,再針對每一條進行提取 houseInfo = list(sell.select(’div.houseInfo’)[0].stripped_strings) # 樓盤名字 loupan = houseInfo[0] # 對樓盤的信息進行分割 info = houseInfo[0].split(’|’) # 房子類型 house_type = info[1].strip() # 面積大小 area = info[2].strip() # 房間朝向 toward = info[3].strip() # 裝修類型 renovation = info[4].strip() # 房屋地址 positionInfo = ’’.join(list(sell.select(’div.positionInfo’)[0].stripped_strings)) # 房屋總價 totalPrice = ’’.join(list(sell.select(’div.totalPrice’)[0].stripped_strings)) # 房屋單價 unitPrice = list(sell.select(’div.unitPrice’)[0].stripped_strings)[0]

以上就是我的分享,如果有什么不足之處請指出,多交流,謝謝!

以上就是python爬取鏈家二手房的數據的詳細內容,更多關于python爬取鏈家二手房的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 中文字幕第100页 | 成年人精品视频在线观看 | 黄色影视在线免费观看 | 午夜私人视频 | 日韩一区二区在线电影 | 四虎影院免费看 | www.久| 精品三级在线观看 | 亚洲国产成人久久一区二区三区 | 成人一区二区三区 | 国产精品美女久久久久久免费 | 一区二区在线 | 国产伦精品久久久一区二区三区 | 久久成人精品一区二区三区 | 日韩在线视频中文字幕 | 国产精品视频导航 | 欧美一区二区三区在线观看视频 | 日韩精品一区二区三区免费观看视频 | 国产精品久久久久久久一区探花 | 亚洲精品久久久久久久久久久 | 91亚洲国产精品 | chinese中国真实乱对白 | 久久精品国产99精品国产亚洲性色 | 精品在线一区二区三区 | 精品视频一区二区三区 | 国产日本欧美在线 | 国产精品成av人在线视午夜片 | 午夜影皖 | 国产97免费视频 | 欧美一区二区三区免费 | 欧美成人在线免费视频 | 国产欧美一区二区精品久久 | 在线视频中文字幕 | 毛片免费观看网址 | 在线播放亚洲 | a∨色狠狠一区二区三区 | 91久久精品一区 | 99精品国产在热久久 | 成人久久久 | 91成人在线免费视频 | 国产精品国产三级国产aⅴ原创 |