基于python實(shí)現(xiàn)檢索標(biāo)記敏感詞并輸出
一些帶有過度宣傳的詞,在淘寶、京東對商品的宣傳有一定的限制,這些最佳,最大、盜版、水貨等詞語都不能用于產(chǎn)品的宣傳,可以使用程序檢測敏感詞,以下既是具體代碼。
#檢索敏感詞并描紅輸出#輸入word = input('請輸入或拷貝含有敏感詞的宣傳文字:')#敏感詞庫sensitive = [’第一’,’國家級(jí)’,’最高級(jí)’,’最佳’,’獨(dú)一無二’,’一流’,’僅此一次’,’頂級(jí)’, ’頂尖’,’尖端’,’極品’,’極佳’,’絕佳’,’絕對’,’終極’,’極致’,’首個(gè)’,’首選’, ’獨(dú)家’,’首發(fā)’,’首次’]#在輸入語句中發(fā)現(xiàn)的敏感詞,放在列表中sensitive_find = []#newword用于標(biāo)紅敏感詞,word用于循環(huán)newword = word#遍歷敏感詞庫for item in sensitive: #將至少出現(xiàn)一次的敏感詞放到sensitive_find中,然后標(biāo)紅 if word.count(item)>0: sensitive_find.append(item+’:’+str(word.count(item))+’次’) #newword存放標(biāo)紅后的整段話,word則不變 newword = newword.replace(item,’ 033[1;31m’+item+’033[0m’)print(’發(fā)現(xiàn)敏感詞如下:’)for item in sensitive_find: print(item)print(’敏感詞位置已用星號(hào)進(jìn)行標(biāo)注:n’+newword)
結(jié)果(ps結(jié)果中有標(biāo)紅的部分,這里未顯示,下面用部分截圖說明一下):
請輸入或拷貝含有敏感詞的宣傳文字:天貓首發(fā),耀世登場,世界品質(zhì),慶偉制造。本產(chǎn)品目前是同類產(chǎn)品中最高級(jí)的。2018年全網(wǎng)銷售量第一,瑤瑤領(lǐng)先同類產(chǎn)品。國內(nèi)外頂級(jí)大師鼎力支持,是您居家生活的唯一選擇。發(fā)現(xiàn)敏感詞如下:第一:1次最高級(jí):1次頂級(jí):1次首發(fā):1次敏感詞位置已用星號(hào)進(jìn)行標(biāo)注:天貓 首發(fā),耀世登場,世界品質(zhì),慶偉制造。本產(chǎn)品目前是同類產(chǎn)品中 最高級(jí)的。2018年全網(wǎng)銷售量 第一,瑤瑤領(lǐng)先同類產(chǎn)品。國內(nèi)外 頂級(jí)大師鼎力支持,是您居家生活的唯一選擇。
有標(biāo)紅部分的截圖
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. XML入門精解之結(jié)構(gòu)與語法2. CSS Hack大全-教你如何區(qū)分出IE6-IE10、FireFox、Chrome、Opera3. CSS3實(shí)例分享之多重背景的實(shí)現(xiàn)(Multiple backgrounds)4. 利用CSS3新特性創(chuàng)建透明邊框三角5. XML入門的常見問題(一)6. HTML5 Canvas繪制圖形從入門到精通7. 概述IE和SQL2k開發(fā)一個(gè)XML聊天程序8. HTML <!DOCTYPE> 標(biāo)簽9. HTML DOM setInterval和clearInterval方法案例詳解10. XML入門的常見問題(二)
