java字符串搜索匹配問題?
問題描述
我有三萬多個詞匯和它們的詞性(就是動詞,名詞,形容詞或者副詞之類的),我想寫個函數(shù)把以參數(shù)的方式傳遞進來的單詞進行詞性分析,然后返回它的詞性。
public int analyze(String word){ // 這個地方應(yīng)該用什么來保存那三萬個詞匯 // 這個地方應(yīng)該用怎樣的數(shù)據(jù)結(jié)構(gòu)或算法來判斷word到底在不在我那個三萬個詞匯里面 // 怎么做才能功效地判斷出word的詞性 return wordType;}
詞匯-詞性表目前是單純的以行為單位的txt文件
word1 tword2 nword3 a
就這樣,我該怎么做呢,應(yīng)該用什么來存儲我的三萬行數(shù)據(jù),txt,json,xml,或者寫到代碼里面放到數(shù)組里面去呢?哪一個循環(huán)起來快一些,有什么好的建議?
問題解答
回答1:你的具體用途是怎樣的,經(jīng)常用到,注重查詢效率?可以用map放內(nèi)存吧
如果不經(jīng)常使用,可以按首字母將詞分割成幾個文件,每次查詢都可以定位到某個文件,更快一點。說實話,三萬其實挺小的,讀起來應(yīng)該不慢,再夸張點你可以放數(shù)據(jù)庫。
如果有更好的想法再回復你
回答2:可以試下hadoop的 map reduce 哦
相關(guān)文章:
1. javascript - 微信報redirect_uri參數(shù)錯誤2. 我在centos容器里安裝docker,也就是在容器里安裝容器,報錯了?3. android - 類似微信朋友圈或者QQ空間說說那種點擊圖片放大,并且有放大縮小手勢,左右滑動圖片手勢效果4. javascript - 怎么簡寫這段jQuery功能?5. 網(wǎng)頁動畫等過渡效果,CSS3 transitions 和 jQuery animations 誰實現(xiàn)的性能更好?6. springboot中不能獲取post請求參數(shù)的解決方法7. java - 初學SSM 在import自己寫的包下的類的時候飄紅,求大神解答?8. javascript - 如何計算字符串寬度?9. java - Atom中文問題10. angular.js - angular中的a標簽不起作用
