python - pythoh3 下 ’<abc>’ 遇到這樣的html轉(zhuǎn)義符如何自動(dòng)轉(zhuǎn)義呢?
問(wèn)題描述
初學(xué)python,在使用scray 爬蟲(chóng)時(shí),遇到html的特殊字符,于是百度搜看了下文檔:
import HTMLParser html_parser = HTMLParser.HTMLParser() s = ’&l t;abc&g t;&nbs p;’ #避免網(wǎng)頁(yè)轉(zhuǎn)義留了個(gè)空格s = html_parser.unescape(s)
運(yùn)行時(shí)提示:import markupbaseImportError: No module named ’markupbase’
借助翻譯軟件,看HTMLParser官方文檔找了第二種方法
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_data(self, data): print(data) return data
parser = MyHTMLParser()s = ’&l t;abc&g t;&nbs p;’ #避免網(wǎng)頁(yè)轉(zhuǎn)義留了個(gè)空格ss=parser.feed(s)
第二種方法測(cè)試成功,遇到的問(wèn)題是,return data 這一句,返回?cái)?shù)據(jù)是無(wú)效的?
請(qǐng)問(wèn),有沒(méi)有就幾句代碼解決轉(zhuǎn)義的,如果沒(méi)有第二種方法里如何才有返回值?
問(wèn)題解答
回答1:from html.parser import HTMLParserhtml_parser = HTMLParser()s = ’<abc> ’txt = html_parser.unescape(s)print(txt)# 結(jié)果:<abc>
相關(guān)文章:
1. android - weex 項(xiàng)目createInstanceReferenceError: Vue is not defined2. android - 哪位大神知道java后臺(tái)的api接口的對(duì)象傳到前端后輸入日期報(bào)錯(cuò),是什么情況?求大神指點(diǎn)3. pdo 寫(xiě)入到數(shù)據(jù)庫(kù)的內(nèi)容為中文的時(shí)候?qū)懭雭y碼4. PHPExcel表格導(dǎo)入數(shù)據(jù)庫(kù)怎么導(dǎo)入5. javascript - 如圖,百度首頁(yè),查看源代碼為什么什么都沒(méi)有?6. vue2.0+webpack 如何使用bootstrap?7. PHP類(lèi)封裝的插入數(shù)據(jù),總是插入不成功,返回false;8. mac連接阿里云docker集群,已經(jīng)卡了2天了,求問(wèn)?9. 微信渠道二維碼怎么使用?10. javascript - 微信上傳圖文素材報(bào)錯(cuò)
