java實現(xiàn)往hive 的map類型字段寫數(shù)據(jù)
該表的該字段類型是map<string,string>
對應(yīng)類的該屬性的類型需要定義成String,不可定義成Map<String,String> !!
方法1:建表語句定義map的分隔符:
row format delimited fields terminated by ’|’ collection items terminated by ’,’ map keys terminated by ’:’ NULL DEFINED AS ’’
然后在java中封裝好map后,不可直接把map.toString()的字符串寫入字段(會有“=”,不能正確組成JSON格式的內(nèi)容),也不可序列化為JSON格式的字符串后寫入字段(會加很多“”)!需要自己定義toString的方法:
public static String insertToMap(Map<String, String> map) {StringBuilder sb = new StringBuilder();Set<String> set = map.keySet();for (String s : set) { sb.append(s).append(':').append(StringUtils.isBlank(map.get(s)) ? 'NULL' : map.get(s)).append(',');}String str = sb.toString();return str.substring(0, str.length() - 1); }
字符串是不帶雙引號和兩端花括號的字符串,這樣插入到字段時,hive會自動為key和value都添加雙引號,也會在兩端添加花括號!(為啥為空時需要把value設(shè)置成NULL?如果為空不寫時,怕hive處理時出錯,可能會處理成帶四個雙引號的NULL,所以手動指定空為'NULL'字符串)
方法2:建表語句不用定義map的分隔符:
然后在java中封裝好map后,不可直接把map.toString()的字符串寫入字段,也不可序列化為JSON格式的字符串后寫入字段!需要自己定義toString的方法:
public static String insertToMap(Map<String, String> map) {StringBuilder sb = new StringBuilder();Set<String> set = map.keySet();for (String s : set) { sb.append(s).append('003').append(StringUtils.isBlank(map.get(s)) ? 'NULL' : map.get(s)).append('002');}String str = sb.toString();return str.substring(0, str.length() - 1); }
得到的則是正確的字段內(nèi)容!
hive中默認(rèn)是用“003”分隔key與value,用“002”分隔兩個鍵值對!
以上是今天嘗試好幾種方法整理后的結(jié)論!
hive-map類型字段的定義與插入map類型定義了一種kv結(jié)構(gòu),在hive中經(jīng)常使用。
如何定義map類型呢?create table employee(id string, perf map<string, int>) ROW FORMAT DELIMITEDFIELDS TERMINATED BY ’t’ COLLECTION ITEMS TERMINATED BY ’,’ MAP KEYS TERMINATED BY ’:’;
其中fields是字段分隔符,collection是每個kv對的分隔符,map keys是k與v的分隔符。
導(dǎo)入數(shù)據(jù)時,只需要按對應(yīng)分隔符處理好數(shù)據(jù)即可。
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
