文章詳情頁(yè)
Java繁體中文處理完全攻略(二)
瀏覽:5日期:2024-06-22 13:09:00
內(nèi)容: 出自:csdn 蔡學(xué)鏞 Java 繁體中文處理完全攻略(二) I/O 轉(zhuǎn)碼 Java 現(xiàn)行的 IO 一律使用 Stream 的方式,相關(guān)的類(lèi)別都放在 java.io 中。輸出 binary 的資料使用 OutputStream 的子類(lèi)別,輸入 binary 的資料使用 InputStream 的子類(lèi)別,輸出文字的資料使用 Writer 的子類(lèi)別,輸入文字的資料使用 Reader 的子類(lèi)別。 你可能會(huì)覺(jué)得很奇怪:「有必要用不同的方式來(lái)處理文字和 binary 嗎?文字資料不也是 binary 的一種?」沒(méi)錯(cuò),其實(shí)他們非常類(lèi)似,最大的差異在于,InputStream/OutputStream 會(huì)原封不動(dòng)地傳送資料,但是 Reader/Writer 會(huì)將資料當(dāng)作文字對(duì)待,所以 Reader/Writer 在「必要時(shí)」會(huì)把(文字)資料轉(zhuǎn)碼。什么時(shí)候才是所謂的「必要時(shí)」呢? Java 的 Stream(包括 Reader 和 Writer)是可以互相串接的。當(dāng) Reader 的資料來(lái)源是另一個(gè) Reader 時(shí),不轉(zhuǎn)碼,當(dāng) Reader 的資料來(lái)源是一個(gè) InputStream 時(shí),就會(huì)轉(zhuǎn)碼。當(dāng) Writer 的資料去處是另一個(gè) Writer 時(shí),不轉(zhuǎn)碼,當(dāng) Writer 的資料去處是一個(gè) OutputStream 時(shí),就會(huì)轉(zhuǎn)碼。 由什么碼轉(zhuǎn)成什么碼?這是可以指定的。因?yàn)檗D(zhuǎn)碼只發(fā)生在 Reader/InputStream 的交界處與 Writer/OutputStream 的交界處,所以正是由 InputStreamReader 和 OutputStreamWriter 此二類(lèi)別負(fù)責(zé),下面兩個(gè) constructor 的第二個(gè)參數(shù),正是用來(lái)指定轉(zhuǎn)碼的方式。 public InputStreamReader(InputStream in, String enc)throws UnsupportedEncodingException;public OutputStreamWriter(OutputStream out, String enc)throws UnsupportedEncodingException; InputStreamReader 負(fù)責(zé)將 enc 的編碼方式轉(zhuǎn)成 Unicode(因?yàn)橘Y料是從「外部」送過(guò)來(lái)給「內(nèi)部」的),OutputStreamWriter 負(fù)責(zé)將 Unicode 的編碼方式轉(zhuǎn)成 enc(因?yàn)橘Y料要從「內(nèi)部」送給「外部」)。JRE 內(nèi)部當(dāng)然都一定是用 Unicode 編碼,而外部的編碼就不一定,要看當(dāng)時(shí)的環(huán)境為何。你可以透過(guò) getEncoding() 的 method,來(lái)得知 InputStreamReader 與 OutputStreamWriter 的編碼方式。 請(qǐng)注意:即使你沒(méi)用到 InputStreamReader 與 OutputStreamWriter,只有用到其它的 Reader 和 Writer,但是這些 Reader 和 Writer 內(nèi)部也很有可能(但非絕對(duì))是直接或間接通到 InputStreamReader 與 OutputStreamWriter。比方說(shuō):FileReader 內(nèi)部其實(shí)是透過(guò)一個(gè) InputStreamReader 的中介來(lái)將資料從 FileInputStream 取過(guò)來(lái)的,此時(shí) InputStreamReader 的轉(zhuǎn)碼方式是采用 OS 的文字編碼(以繁體中文的 Windows 為例,就是「MS950」)轉(zhuǎn)成 Unicode。 如果你清楚地知道你要讀寫(xiě)的檔案(或資料來(lái)源 / 去處)是采用某種編碼方式,你也可以主動(dòng)指定編碼方式。但是,請(qǐng)記得抓取可能導(dǎo)致的 UnsupportedEncodingException,并務(wù)必處理之,不可對(duì)此例外置之不理,因?yàn)樵?JRE 有可能沒(méi)有附上此種編碼表(也有可能你的編碼名稱(chēng)給錯(cuò))。 檔案 I/O 轉(zhuǎn)碼 如果你是在泰文版的 Windows 上,想讀取用 MS950 編碼的繁體中文文字文件,你就必須主動(dòng)指定編碼,不可以直接用 FileReader,否則無(wú)法成功讀取。方法如下: FileInputStream fis = new FileInputStream(fileName);InputStreamReader reader = new InputStreamReader(fis, 'MS950'); 然后,透過(guò) Reader 讀出來(lái)的就會(huì)是正確的中文。 網(wǎng)絡(luò) I/O 轉(zhuǎn)碼 如果你的網(wǎng)絡(luò)程序采用 TCP,那么你可以透過(guò) Socket 類(lèi)別所提供的 getInputStream() 和 getOutputStream() 來(lái)得到 InputStream 和 OutputStream 對(duì)象。如果你是在泰文版的 Windows 上,想讀取用 MS950 編碼的繁體中文文字 TCP 網(wǎng)絡(luò)串流,你可以用類(lèi)似上面的技巧來(lái)轉(zhuǎn)碼。方法如下: InputStream is = mySocket.getInputStream();InputStreamReader reader = new InputStreamReader(is, 'MS950'); 如果你的網(wǎng)絡(luò)程序采用 UDP,你必須把中文字符串轉(zhuǎn)成(或轉(zhuǎn)自)byte 數(shù)組。請(qǐng)看下一節(jié)「 字符串和 byte 數(shù)組的轉(zhuǎn)碼 」。 如果你的網(wǎng)絡(luò)程序采用 RMI,那你完全不用為這部分的轉(zhuǎn)碼操心,字符串直接用 Unicode 在網(wǎng)絡(luò)上傳遞給另一個(gè) JRE,不需要轉(zhuǎn)碼。 保持刑案現(xiàn)場(chǎng) 如果你不知道你的 I/O 資料來(lái)源或去處是用何種編碼方式,那么你最好不要用 Reader 和 Writer,而應(yīng)該直接用 InputStream 和 OutputStream,因?yàn)榕c其被 Reader 和 Writer 胡亂編碼之后造成信息遺失或錯(cuò)亂,不如保持資料的完整不變,留待以后進(jìn)一步解讀。 字符串和 byte 數(shù)組的轉(zhuǎn)碼 java.lang.String 類(lèi)別是 Java 字符串對(duì)象的類(lèi)別,Java 字符串對(duì)象既然是活在 JRE 內(nèi)部,當(dāng)然就一定是用 Unicode 編碼。如果你需要將 String 對(duì)象和 byte 數(shù)組互轉(zhuǎn),你可以使用: String(byte[] bytes, int offset, int length, String enc); 或 String(byte[] bytes, String enc); 來(lái)將用 enc 編碼的 byte 數(shù)組,轉(zhuǎn)成 Unicode 的 String 對(duì)象。你也可以使用 String 對(duì)象所提供的: byte[] getBytes(String enc) 來(lái)將 String 對(duì)象轉(zhuǎn)成 byte 數(shù)組。 另外,你也可以透過(guò) ByteArrayInputStream 或 ByteArrayOutputStream 串接到 InputStreamReader 或 OutputStreamWriter,來(lái)達(dá)到轉(zhuǎn)碼的目的。 Java, java, J2SE, j2se, J2EE, j2ee, J2ME, j2me, ejb, ejb3, JBOSS, jboss, spring, hibernate, jdo, struts, webwork, ajax, AJAX, mysql, MySQL, Oracle, Weblogic, Websphere, scjp, scjd
標(biāo)簽:
Java
相關(guān)文章:
1. php中的時(shí)間處理2. Ajax對(duì)xml信息的接收和處理操作實(shí)例分析3. PHP將人民幣中金額數(shù)字轉(zhuǎn)化為中文大寫(xiě)代碼4. 小技巧處理div內(nèi)容溢出5. Android Studio升級(jí)3.6 Build窗口出現(xiàn)中文亂碼問(wèn)題解決方法6. PHP和JS之間的數(shù)據(jù)交互并處理7. python 對(duì)圖片進(jìn)行簡(jiǎn)單的處理8. python中執(zhí)行smtplib失敗的處理方法9. 淺析Python 字符編碼與文件處理10. Java編程中關(guān)于異常處理的10個(gè)最佳實(shí)踐
排行榜
