久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

您的位置:首頁技術文章
文章詳情頁

python爬取”頂點小說網“《純陽劍尊》的示例代碼

瀏覽:12日期:2022-07-08 09:42:02

爬取”頂點小說網“《純陽劍尊》

代碼

import requestsfrom bs4 import BeautifulSoup# 反爬headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36’}# 獲得請求def open_url(url): response = requests.get(url, headers=headers) response.encoding = response.apparent_encoding html = response.text return html# 提取標題def get_title(url): soup = BeautifulSoup(url, ’lxml’) title_tag = soup.find(’dd’) title = ’n’ + title_tag.h1.get_text() + ’n’ return title# 提取文本def get_texts(url): soup2 = BeautifulSoup(url, ’lxml’) text_tags = soup2.find_all(’dd’, id='contents') return text_tags# 保存標題def save_title(filename, title): with open(filename, ’a+’, encoding=’utf-8’) as file: file.write(title)# 保存文本def save_text(filename, text): with open(filename, ’a+’, encoding=’utf-8’) as file: file.write(text)# 主程序函數def main(): num = input(’《純陽劍尊》你想要下載第幾章?(1-802)’) num = int(num) number = 8184027 + num url = ’https://www.23us.so/files/article/html/15/15905/’ + str(number) + ’.html’ filename = ’純陽劍尊.txt’ r = open_url(url) title = get_title(r) tags = get_texts(r) save_title(filename, title) for text_tag in tags: text = text_tag.get_text() + ’n’ save_text(filename, text) print(’第{}章已經下載完成!’.format(num))if __name__ == ’__main__’: main()

爬取結果:

python爬取”頂點小說網“《純陽劍尊》的示例代碼

python爬取”頂點小說網“《純陽劍尊》的示例代碼

以上就是python爬取”頂點小說網“《純陽劍尊》的示例代碼的詳細內容,更多關于python 爬取頂點小說網的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 日韩三级电影免费观看 | 一级毛片免费看 | 四虎影院免费看 | 久久99精品久久久久蜜臀 | porn一区 | 中文字幕天天操 | 最新国产中文字幕 | 欧美综合久久久 | 一级黄色国产 | 在线小视频 | 国产男女免费视频 | 一区二区三区日本 | 亚洲精品久久久久avwww潮水 | 成人超碰在线观看 | 亚洲性片 | 播放一区 | 思热99re视热频这里只精品 | 天堂精品 | 亚洲福利一区 | h亚洲视频 | 色婷婷国产精品免费网站 | www.天天操 | 欧美成年网站 | 精品国产精品三级精品av网址 | 91高清免费 | а天堂中文最新一区二区三区 | 一本大道综合伊人精品热热 | 亚洲欧美日韩精品久久亚洲区 | 91免费看片 | 91综合网| 一区二区三区四区在线 | 日韩 国产 在线 | 国产乱码一区二区三区在线观看 | 欧美一区二区三区精品免费 | 国产精品久久久久久久一区探花 | 在线国产一区 | 成年免费a级毛片 | 五月在线视频 | 国产精品久久久久久久粉嫩 | 久草电影网 | 黄色在线免费观看 |