基于Python詞云分析政府工作報(bào)告關(guān)鍵詞
前言
十三屆全國人大三次會(huì)議作了政府工作報(bào)告。這份政府工作報(bào)告僅有10500字左右,據(jù)悉是改革開放40年以來最短的一次。受到疫情影響,今年的兩會(huì)會(huì)議適當(dāng)縮短,政府工作報(bào)告也大幅壓縮,體現(xiàn)了“實(shí)干為要”的理念。那么,這份政府工作報(bào)告突出強(qiáng)調(diào)了哪些關(guān)鍵詞呢?我們其實(shí)可以基于Python技術(shù)進(jìn)行詞頻分析和詞云制作!
import matplotlib.pyplot as plt#繪圖庫import jiebafrom wordcloud import WordCloud# 讀入文本數(shù)據(jù)fp = open(r’D:爬蟲下載2020年政府工作報(bào)告.txt’,’r’,encoding=’utf-8’)content = fp.read()# print(content)#分詞words = jieba.lcut(content)# 詞頻分析操作data = {}for word in words: if len(word)>1: if word in data: data[word]+=1 else: data[word]=1# print(data)#排序hist = list(data.items())#轉(zhuǎn)成列表hist.sort(key=lambda x:x[1],reverse=True)# print(hist)#調(diào)試輸出for i in range(20): # print(hist[i]) print(’{:<10}{:>5}’.format(hist[i][0],hist[i][1]))#左對齊10,右對齊5個(gè)長度
下表統(tǒng)計(jì)了今年的政府工作報(bào)告中出現(xiàn)次數(shù)最多的幾個(gè)關(guān)鍵詞。我們可以看到,今年的政府工作報(bào)告中提到“發(fā)展”的次數(shù)最多,一共出現(xiàn)了69次,“發(fā)展”一直都是政府工作報(bào)告中的重要關(guān)鍵詞;其次是“就業(yè)”,出現(xiàn)了39次,足以顯示新冠疫情之下就業(yè)問題的嚴(yán)峻性,以及黨中央、國務(wù)院對就業(yè)問題的高度重視,政府工作報(bào)告中沒有提出全年經(jīng)濟(jì)增速的具體目標(biāo),但仍然提出了就業(yè)目標(biāo)——城鎮(zhèn)新增就業(yè)900萬人以上、城鎮(zhèn)調(diào)查失業(yè)率6%左右、城鎮(zhèn)登記失業(yè)率5.5%左右;第三多的就是“疫情”,報(bào)告中多次提到疫情防控工作,并指出這次新冠肺炎疫情,是新中國成立以來我國遭遇的傳播速度最快、感染范圍最廣、防控難度最大的公共衛(wèi)生事件。
“企業(yè)”作為市場經(jīng)濟(jì)的主體,出現(xiàn)的次數(shù)達(dá)到了30次,要想保障就業(yè)和民生,必須穩(wěn)住上億市場主體,盡力幫助企業(yè)特別是中小微企業(yè)、個(gè)體工商戶渡過難關(guān),報(bào)告提出要加大宏觀政策實(shí)施力度,著力穩(wěn)企業(yè)保就業(yè)。還有“支持”、“保障”、“加強(qiáng)”、“推進(jìn)”等鼓舞人心的關(guān)鍵詞出現(xiàn)次數(shù)也很多,相信大家看到政府工作報(bào)告中滿滿的政策“干貨”,信心和底氣也會(huì)更足了。
根據(jù)關(guān)鍵詞的出現(xiàn)次數(shù),我們可以使用Python繪制出政府工作報(bào)告詞云圖。Python的詞云功能相當(dāng)強(qiáng)大,你可以自己設(shè)定形狀、字體、大小!
result = ’ ’.join(words)# print(result)#生成詞云wc = WordCloud( font_path=r’D:PPTppt字體思源宋體SC-Regular.otf’, background_color = ’white’,#背景顏色 width=500,#圖片的寬 height=300, max_font_size=50, min_font_size=12)wc.generate(result)wc.to_file(r’.wordcloud.png’)#保存圖片#顯示圖片plt.figure(’政府工作報(bào)告’)plt.imshow(wc)plt.axis(’off’)#關(guān)閉坐標(biāo)軸plt.show()
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. Ajax實(shí)現(xiàn)表格中信息不刷新頁面進(jìn)行更新數(shù)據(jù)2. asp(vbs)Rs.Open和Conn.Execute的詳解和區(qū)別及&H0001的說明3. 解決AJAX返回狀態(tài)200沒有調(diào)用success的問題4. PHP設(shè)計(jì)模式中工廠模式深入詳解5. CSS hack用法案例詳解6. JSP數(shù)據(jù)交互實(shí)現(xiàn)過程解析7. ASP 信息提示函數(shù)并作返回或者轉(zhuǎn)向8. 利用promise及參數(shù)解構(gòu)封裝ajax請求的方法9. ThinkPHP5實(shí)現(xiàn)JWT Token認(rèn)證的過程(親測可用)10. .NET中l(wèi)ambda表達(dá)式合并問題及解決方法
