文章詳情頁

python - scrapy爬蟲不能循環(huán)運行？

瀏覽：96日期：2022-07-28 11:08:58

問題描述

scrapy只能爬取一個頁面上的鏈接，不能持續(xù)運行爬完全站，以下是代碼，初學(xué)求指導(dǎo)。

class DbbookSpider(scrapy.Spider): name = 'imufe' allowed_domains = [’http://www.imufe.edu.cn/’] start_urls=(’http://www.imufe.edu.cn/main/dtxw/201704/t20170414_127035.html’) def parse(self, response):item = DoubanbookItem()selector = scrapy.Selector(response)print(selector)books = selector.xpath(’//a/@href’).extract()link=[]for each in books: each=urljoin(response.url,each) link.append(each)for each in link: item[’link’] = each yield itemi = random.randint(0,len(link)-1)nextPage = link[i]yield scrapy.http.Request(nextPage,callback=self.parse)

問題解答

回答1：

是不是爬得太快讓封了

Python 編程

上一條：mysql - Python創(chuàng)建相同結(jié)構(gòu)的多個數(shù)據(jù)庫表，表名是循環(huán)添加的。下一條：module - python模塊from import語句相對導(dǎo)入，加不加點號有什么區(qū)別？

相關(guān)文章：

1. 求大神支招，php怎么操作在一個html文件的<head>標(biāo)記內(nèi)添加內(nèi)容？2. 安裝了“PHP工具箱”，但只能以“游客”身份登錄3. 老師們php,插入數(shù)據(jù)庫mysql，都是空的，要怎么解決4. 跨類調(diào)用后，找不到方法5. 在mybatis使用mysql的ON DUPLICATE KEY UPDATE語法實現(xiàn)存在即更新應(yīng)該使用哪個標(biāo)簽?6. 致命錯誤: Class ’appfacadeTest’ not found7. 在應(yīng)用配置文件 app.php 中找不到’route_check_cache’配置項8. PHP類屬性聲明？9. 怎么php怎么通過數(shù)組顯示sql查詢結(jié)果呢，查詢結(jié)果有多條，如圖。10. phpstady在win10上運行

排行榜

					
					mysql - sysbench cpu測試的結(jié)果看不懂，求解
【python小白】  問關(guān)于property的順序問題
javascript - vuejs+elementui 購物車價格計算，點擊加減號修改數(shù)量總價都不會改變，但是計算執(zhí)行了
在MySQL中，執(zhí)行了DELIMITER // 這個語句后分號還有什么作用？
javascript - 切換掉當(dāng)前頁面后該頁面的js動畫會暫停？
前端 - 求解？這種寫法怎么理解
mysql優(yōu)化 - mysql update和delete和insert 操作多條數(shù)據(jù)的背后情況
javascript - pluploader這個上傳插件能異步上傳嗎
sql語句 - 如何在mysql中批量添加用戶？
在mybatis使用mysql的ON DUPLICATE KEY UPDATE語法實現(xiàn)存在即更新應(yīng)該使用哪個標(biāo)簽?
docker內(nèi)創(chuàng)建jenkins訪問另一個容器下的服務(wù)器問題
				

熱門標(biāo)簽

久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

python - scrapy爬蟲不能循環(huán)運行？