python 利用jieba.analyse進行 關鍵詞提取
代碼如下:
#!/usr/bin/env python# -*- coding: utf-8 -*-# @File : jieba.analyse.py# @Author: 趙路倉# @Date : 2020/3/14# @Desc : 提取關鍵字# @Contact : 398333404@qq.comimport jieba.analysetext=’安全、防止水合物和段塞生成的重要措施之一。因此,針對未來還上油田開發技術,我們預先開展了水深1500米管道式油氣水分離器的概念設計。通過該研究,提出適合海洋環境的體積小、重量輕、分離效率高、便于操作和維護的新型油氣水三相分離器,使其成為海洋深水油氣田開’Key=jieba.analyse.extract_tags(text,topK=3)print(Key)
keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) 第一個參數:待提取關鍵詞的文本 第二個參數:返回關鍵詞的數量,重要性從高到低排序 第三個參數:是否同時返回每個關鍵詞的權重 第四個參數:詞性過濾,為空表示不過濾,若提供則僅返回符合詞性要求的關鍵詞
代碼如下:
#!/usr/bin/env python# -*- coding: utf-8 -*-# @File : jieba.analyse.py# @Author: 趙路倉# @Date : 2020/3/14# @Desc : 提取關鍵字# @Contact : 398333404@qq.comimport jieba.analyse# 字符串前面加u表示使用unicode編碼content = u’安全、防止水合物和段塞生成的重要措施之一。因此,針對未來還上油田開發技術,我們預先開展了水深1500米管道式油氣水分離器的概念設計。通過該研究,提出適合海洋環境的體積小、重量輕、分離效率高、便于操作和維護的新型油氣水三相分離器,使其成為海洋深水油氣田開’keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())# 訪問提取結果for item in keywords: # 分別為關鍵詞和相應的權重 print(item[0], item[1])
以上就是python 利用jieba.analyse進行 關鍵詞提取的詳細內容,更多關于python 關鍵詞提取的資料請關注好吧啦網其它相關文章!
相關文章:
