如何在django中運(yùn)行scrapy框架
1.新建一個(gè)django項(xiàng)目,
2.前端展示一個(gè)按鈕
<form action='/start/' method='POST'> {% csrf_token %} <input type='submit' value='啟動(dòng)爬蟲'></form>
3.在django項(xiàng)目的根目錄創(chuàng)建scrapy項(xiàng)目
4.cmd命令行運(yùn)行:scrapyd 啟動(dòng)服務(wù)
5.將scrapy項(xiàng)目部署到當(dāng)前工程:scrapyd-deploy 爬蟲名稱 -p 項(xiàng)目名稱
6.views.py
# 首頁def index(request): return render(request,’index.html’,locals())def start(request): if request.method == ’POST’: # 啟動(dòng)爬蟲 url = ’http://localhost:6800/schedule.json’ data = {’project’: ’ABCkg’, ’spider’: ’abckg’} print(requests.post(url=url, data=data)) return JsonResponse({’result’:’ok’})
7.在本地6800端口點(diǎn)擊jobs當(dāng)前爬蟲項(xiàng)目就在運(yùn)行了。
8.寫一個(gè)按鈕,點(diǎn)擊停止scrapy爬蟲
def stop(request): if request.method == ’POST’: # 停止爬蟲 url = ’http://127.0.0.1:6800/cancel.json’ data={'project':’ABCkg’,’job’:’b7fe64ee7ad711e9b711005056c00008’} print(requests.post(url=url, data=data)) return JsonResponse({’result’:’stop’})
總結(jié):
----------------scrapyd 管理----------------------
1、獲取狀態(tài)
http://127.0.0.1:6800/daemonstatus.json
2、獲取項(xiàng)目列表
http://127.0.0.1:6800/listprojects.json
3、獲取項(xiàng)目下已發(fā)布的爬蟲列表
http://127.0.0.1:6800/listspiders.json?project=myproject
4、獲取項(xiàng)目下已發(fā)布的爬蟲版本列表
http://127.0.0.1:6800/listversions.json?project=myproject
5、獲取爬蟲運(yùn)行狀態(tài)
http://127.0.0.1:6800/listjobs.json?project=myproject
6、啟動(dòng)服務(wù)器上某一爬蟲(必須是已發(fā)布到服務(wù)器的爬蟲)
http://localhost:6800/schedule.json
(post方式,data={'project':myproject,'spider':myspider})
7、刪除某一版本爬蟲
http://127.0.0.1:6800/delversion.json -d project=項(xiàng)目名 -d versions
(post方式,data={'project':myproject,'version':myversion})
8、刪除某一工程,包括該工程下的各版本爬蟲
http://127.0.0.1:6800/delproject.json
(post方式,data={'project':myproject})
9、取消爬蟲
http://127.0.0.1:6800/cancel.json
(post方式,data={'project':myproject,’job’:myjob})
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. 基于javaweb+jsp實(shí)現(xiàn)企業(yè)財(cái)務(wù)記賬管理系統(tǒng)2. Java 生成帶Logo和文字的二維碼3. asp讀取xml文件和記數(shù)4. 低版本IE正常運(yùn)行HTML5+CSS3網(wǎng)站的3種解決方案5. XHTML 1.0:標(biāo)記新的開端6. python中的socket實(shí)現(xiàn)ftp客戶端和服務(wù)器收發(fā)文件及md5加密文件7. xml中的空格之完全解說8. python 實(shí)現(xiàn)圖片修復(fù)(可用于去水印)9. 怎樣才能用js生成xmldom對象,并且在firefox中也實(shí)現(xiàn)xml數(shù)據(jù)島?10. Javaweb工程運(yùn)行報(bào)錯(cuò)HTTP Status 404解決辦法
