久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

您的位置:首頁技術文章
文章詳情頁

javascript - node爬取微博

瀏覽:99日期:2022-06-24 14:18:08

問題描述

剛接觸node,想寫個爬蟲,爬取新浪微博評論,但是發現頁面是由JS動態生成的,用http模塊爬取不到,然后用phantomjs爬取,(聽說會比較慢,運行了近15分鐘,這也太慢了,不知是否寫錯),還是不行,問一下有什么辦法能夠爬取類似于新浪微博的網頁嗎?

let page=require('webpage').create();let url='http://weibo.com/1713926427/Etq2WnSiR?filter=hot&root_comment_id=0&type=comment';/*page.settings = { javascriptEnabled: true, loadImages: false, webSecurityEnabled: false, userAgent: ’Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.137 Safari/537.36 LBBROWSER’};*/page.open(url,(status)=>{ console.log('Status:'+status); if(status=='success'){let val = page.evaluate(()=>{ var list_box=document.querySelector('.list_box'); console.log(list_box); return list_box});console.log(val) }else{console.log('failed') } phantom.exit();});

問題解答

回答1:

自己寫過微博的爬取,有兩種思路

仔細看一下應該是有接口去獲取相應數據的然后用正則去匹配

微博提供了開發者API接口的,雖然用著比較麻煩

標簽: 微博
相關文章:
主站蜘蛛池模板: 国产日韩免费 | 五月天狠狠爱 | 日韩一区二区在线免费 | 欧美一级全黄 | 久久综合成人精品亚洲另类欧美 | 久草中文在线 | 国产精品久久久久久久久久久久久 | 日韩成人在线视频 | 精品国产乱码久久久久久1区2区 | 国产精品久久久久久久久久久免费看 | 精品国产91亚洲一区二区三区www | 国产一级免费 | 日日夜夜草 | 奇米av在线| 国产视频2021| 最近免费中文字幕在线视频2 | 成人免费毛片嘿嘿连载视频 | 亚洲一区播放 | 在线成人av | 日韩第一区 | 色5月婷婷丁香六月 | 一本一本久久a久久精品综合妖精 | 国产精品久久久久久久久久久久久久久久 | 97狠狠 | 国产中文字幕一区 | yiren22综合网成人 | 国产日韩精品一区二区 | 久久新| 国产精成人 | 午夜精品视频 | 最新国产视频 | 亚洲午夜精品视频 | 91亚洲国产成人久久精品网站 | 久久久高清 | 天天干天天操 | 久久性色 | 成人在线播放网站 | 一区二区三区国产 | 欧美精品 在线观看 | 日韩精品免费在线观看 | 91麻豆久久久 |