久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

您的位置:首頁技術文章
文章詳情頁

Python Scrapy框架:通用爬蟲之CrawlSpider用法簡單示例

瀏覽:5日期:2022-07-30 13:12:21

本文實例講述了Python Scrapy框架:通用爬蟲之CrawlSpider用法。分享給大家供大家參考,具體如下:

步驟01: 創(chuàng)建爬蟲項目

scrapy startproject quotes

步驟02: 創(chuàng)建爬蟲模版

scrapy genspider -t quotes quotes.toscrape.com

步驟03: 配置爬蟲文件quotes.py

import scrapyfrom scrapy.spiders import CrawlSpider, Rulefrom scrapy.linkextractors import LinkExtractorclass Quotes(CrawlSpider): # 爬蟲名稱 name = 'get_quotes' allow_domain = [’quotes.toscrape.com’] start_urls = [’http://quotes.toscrape.com/’]# 設定規(guī)則 rules = ( # 對于quotes內(nèi)容頁URL,調(diào)用parse_quotes處理, # 并以此規(guī)則跟進獲取的鏈接 Rule(LinkExtractor(allow=r’/page/d+’), callback=’parse_quotes’, follow=True), # 對于author內(nèi)容頁URL,調(diào)用parse_author處理,提取數(shù)據(jù) Rule(LinkExtractor(allow=r’/author/w+’), callback=’parse_author’) )# 提取內(nèi)容頁數(shù)據(jù)方法 def parse_quotes(self, response): for quote in response.css('.quote'): yield {’content’: quote.css(’.text::text’).extract_first(), ’author’: quote.css(’.author::text’).extract_first(), ’tags’: quote.css(’.tag::text’).extract() } # 獲取作者數(shù)據(jù)方法 def parse_author(self, response): name = response.css(’.author-title::text’).extract_first() author_born_date = response.css(’.author-born-date::text’).extract_first() author_bron_location = response.css(’.author-born-location::text’).extract_first() author_description = response.css(’.author-description::text’).extract_first() return ({’name’: name, ’author_bron_date’: author_born_date, ’author_bron_location’: author_bron_location, ’author_description’: author_description })

步驟04: 運行爬蟲

scrapy crawl quotes

更多相關內(nèi)容可查看本站專題:《Python Socket編程技巧總結》、《Python正則表達式用法總結》、《Python數(shù)據(jù)結構與算法教程》、《Python函數(shù)使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》

希望本文所述對大家基于Scrapy框架的Python程序設計有所幫助。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 精品国产乱码久久久久夜 | 国产一区二区三区免费视频 | 国产视频色 | 成人 在线 | 国产午夜久久 | 一区二区中文字幕 | 久久伊人操 | 一区二区三区在线免费播放 | 精品日韩 | 亚洲精品久久久久久久久久久 | 成人a在线视频免费观看 | 国产69久久 | 亚洲综合色自拍一区 | 欧美一级在线观看 | 国产在线不卡 | 一区二区三区高清不卡 | 午夜操操 | 亚洲福利片 | 精品美女久久久 | 精品无人乱码一区二区三区 | 欧美综合色 | 99爱视频| 国产精品久久久久久久久久99 | 中文字幕一二区 | 久久久综合色 | 操操操av | 亚洲免费精品 | 日韩91精品 | 一区二区不卡 | 午夜草逼 | 精品一区在线 | 国产精品久久国产精品99 gif | 欧美亚洲激情 | 日韩av入口| 亚洲精品国产成人 | 日韩中文在线 | 精品一区二区三区中文字幕 | av中文字幕在线播放 | 精品国产天堂 | 国产精品久久一区二区三区 | 成人中文字幕在线 |