java - 關于字符串編碼。
問題描述
public static void main(String[] args) throws Exception { String str = 'resource'; System.out.println(Arrays.toString(getHash(str,'MD5').getBytes()));//使用默認解碼后輸出}public static String getHash(String str, String hashType) { try {MessageDigest digest = MessageDigest.getInstance(hashType);digest.reset();byte[] b = digest.digest(str.getBytes());System.out.println(Arrays.toString(b)); //編碼前輸出return new String(b); //使用默認編碼 } catch (NoSuchAlgorithmException e) {e.printStackTrace(); } return str;}
輸出:[-106, -85, 78, 22, 63, 78, -32, 58, -86, 77, 16, 81, -86, 81, -46, 4]
[-17, -65, -67, -17, -65, -67, 78, 22, 63, 78, -17, -65, -67, 58, -17, -65, -67, 77, 16, 81, -17, -65, -67, 81, -17, -65, -67, 4]
為什么編碼前和編碼后再解碼所輸出的不一樣?
問題解答
回答1:你可能認為(new String(b)).getBytes().equals(b),實際上并非如此。(盡管new String(s.getBytes()).equals(s)一定是。)
因為byte[]轉換成String時,有些字節是未必能轉換成字符的,比如第一個-106、第二個-85就是,所以轉換成String時前兩個就變成了未知字符(表面上會顯示?,但實際上是一個Unicode字符),再轉成byte[](你這邊defaultCharset應該是UTF-8吧),每個未知字符就變成3個字節了。
如果用GBK的話,情況還算好,但還是略有不同:
[-106, -85, 78, 22, 63, 78, -32, 58, -86, 77, 16, 81, -86, 81, -46, 4][-106, -85, 78, 22, 63, 78, 63, 58, -86, 77, 16, 81, -86, 81, 63, 4]
所以結論是:如果用String表示一個Hash值,不能把byte[]強轉換成String,而是按慣例轉換成16進制表示。
相關文章:
1. css3 - 求教CSS圖標庫的寫法,也就是先做雪碧圖,然后寫一個css表,用的時候直接用class就可以了2. 百度地圖api - Android百度地圖SDK,MapView上層按鈕可見卻不可觸,怎么解決?3. html - 前端大牛都頂一下!CSS鼠標樣式問題,如圖所示4. javascript - es6擴展運算符...的問題5. 網頁爬蟲 - python爬蟲用BeautifulSoup爬取<s>元素并寫入字典,但某些div下沒有這一元素,導致自動寫入下一條,如何解決?6. node.js - 在nodejs環境中如何配置webhook以實現hexo博客的自動更新?7. html5 - canvas中的mousedrag事件,為什么鼠標拖出canvas,然后再次移入canvas,drag事件還觸發8. javascript - jquery怎么給select option一個點擊時觸發的事件,如圖 如果選擇自定義觸發一個時間?9. 新入手layuiadmin,部署到tp中。想用php自已寫一個后臺管理系統。10. mysql 獲取時間函數unix_timestamp 問題?
