MySQL修改字符集的實(shí)戰(zhàn)教程
在 MySQL 中,系統(tǒng)支持諸多字符集,不同字符集之間也略有區(qū)別。目前最常用的字符集應(yīng)該是 utf8 和 utf8mb4 了,相比于 utf8 ,utf8mb4 支持存儲(chǔ) emoji 表情,使用范圍更廣。本篇文章將會(huì)介紹 utf8 修改成 utf8mb4 字符集的方法。
1. utf8 和 utf8mb4 字符集介紹字符(Character)是各種文字和符號(hào)的總稱,包括各國家文字、標(biāo)點(diǎn)符號(hào)、圖形符號(hào)、數(shù)字等。字符集(Character set)是多個(gè)字符的集合。
MySQL 中字符集可以作用于四個(gè)級(jí)別,分別是:服務(wù)器級(jí)別、數(shù)據(jù)庫級(jí)別、表級(jí)別、列級(jí)別。服務(wù)器級(jí)別的比較規(guī)則由 character_set_server 參數(shù)控制,如果創(chuàng)建數(shù)據(jù)庫、表、列時(shí)沒有顯式的指定字符集,則會(huì)繼承上一級(jí)的字符集。
MySQL 5.7 及之前版本默認(rèn)的字符集是 latin1 ,MySQL 8.0 版本默認(rèn)的字符集是 utf8mb4 。不過使用 latin1 容易導(dǎo)致亂碼,所以還是 utf8 和 utf8mb4 用途最廣泛。utf8 其實(shí)是 utf8mb3 的別名,只使用 1~3 個(gè)字節(jié)表示字符。utf8mb4 使用 1~4 個(gè)字節(jié)表示字符,能夠存儲(chǔ)更多的 emoji 表情及任何新增的 Unicode 字符。utf8mb4 兼容 utf8 ,且比 utf8 能表示更多的字符,是 utf8 字符集的超集。所以現(xiàn)在一些新的業(yè)務(wù)建議將數(shù)據(jù)庫的字符集設(shè)置為 utf8mb4 ,特別是有表情存儲(chǔ)需求時(shí)。
2. 修改字符集方法目前的互聯(lián)網(wǎng)業(yè)務(wù)對 emoji 表情存儲(chǔ)的需求越來越多,比如昵稱、評論內(nèi)容等都要支持表情符號(hào),這個(gè)時(shí)候如果數(shù)據(jù)庫字段用的是 utf8 字符集,則會(huì)報(bào)如下錯(cuò)誤:
java.sql.SQLException: Incorrect string value: ’xF0x9Fx92x95xF0x9F...’ for column…………
為了業(yè)務(wù)需求,我們需要將數(shù)據(jù)庫字符集改為 utf8mb4 ,好在 utf8mb4 是 utf8 的超集,除了將編碼改為 utf8mb4 外不需要做其他轉(zhuǎn)換。這里簡單講下修改方法。
系統(tǒng)參數(shù)修改首先應(yīng)該修改系統(tǒng)字符集參數(shù),這樣以后創(chuàng)建的庫表默認(rèn)字符集就是 utf8mb4 了。找到配置文件,添加或修改以下參數(shù):
vi /etc/my.cnf[mysqld]character-set-server = utf8mb4collation-server = utf8mb4_general_ciskip-character-set-client-handshake#忽略應(yīng)用連接自己設(shè)置的字符編碼,保持與全局設(shè)置一致[client]default-character-set=utf8mb4[mysql]default-character-set=utf8mb4修改數(shù)據(jù)庫字符集
對于已經(jīng)創(chuàng)建的數(shù)據(jù)庫,如果原來是 utf8 字符集,則可以這么修改:
# 設(shè)置數(shù)據(jù)庫字符集編碼ALTER DATABASE `dbname` CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;# 示例mysql> show create database testdb;+----------+-----------------------------------------------------------------+| Database | Create Database |+----------+-----------------------------------------------------------------+| testdb | CREATE DATABASE `testdb` /*!40100 DEFAULT CHARACTER SET utf8 */ |+----------+-----------------------------------------------------------------+1 row in set (0.00 sec)mysql> alter database `testdb` CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;Query OK, 1 row affected (0.01 sec)mysql> show create database testdb;+----------+--------------------------------------------------------------------+| Database | Create Database |+----------+--------------------------------------------------------------------+| testdb | CREATE DATABASE `testdb` /*!40100 DEFAULT CHARACTER SET utf8mb4 */ |+----------+--------------------------------------------------------------------+1 row in set (0.00 sec)修改表及字段字符集
同樣的,對于已經(jīng)創(chuàng)建的表,修改全局及數(shù)據(jù)庫的字符集并不會(huì)影響原表及字段的字符集。原有的 utf8 表可以采用如下方法修改:
# 修改表字符集alter table `tb_name` default character set utf8mb4;# 修改某字段字符集alter table `tb_name` modify col_name varchar(20) character set utf8mb4;# 同時(shí)修改表及字段字符集alter table `tb_name` CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;# 如果某個(gè)庫里面表比較多 可以拼接出要執(zhí)行的批量修改語句SELECT CONCAT( ’ALTER TABLE ’, TABLE_NAME, ’ CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;’ ) FROM information_schema.`TABLES` WHERE TABLE_SCHEMA = ’testdb’;3. 一些建議
看起來修改方法挺簡單,不過對于生產(chǎn)環(huán)境還是要格外小心。特別是修改字段字符集時(shí),會(huì)加鎖,阻止寫操作,對于大表執(zhí)行下來也是很慢的,可能對線上業(yè)務(wù)造成影響。
如果你的數(shù)據(jù)庫比較小,用以上方法應(yīng)該問題不大。對于線上環(huán)境,若要修改字符集,一定要做好評估,最好可以在業(yè)務(wù)低峰期停機(jī)修改,修改前一定要先備份。若無停機(jī)時(shí)間,可以考慮先在備庫修改,然后再主備切換,不過這樣做會(huì)更麻煩。
有條件的話也可以再準(zhǔn)備一個(gè)空實(shí)例,先導(dǎo)入表結(jié)構(gòu),改成 utf8mb4 字符集后再導(dǎo)入數(shù)據(jù)。這也是一種方法,不過也可能需要停機(jī)切換。
以上就是MySQL修改字符集的方法的詳細(xì)內(nèi)容,更多關(guān)于MySQL修改字符集的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. SQLite教程(六):表達(dá)式詳解2. Mysql入門系列:建立MYSQL客戶機(jī)程序的一般過程3. 導(dǎo)出錯(cuò)誤編碼的mysql數(shù)據(jù)庫4. SQLite3 API 編程手冊5. 使用 UIMA 和 DB2 Intelligent Miner 進(jìn)行文本挖掘6. DB2數(shù)據(jù)庫的隔離級(jí)解讀與試驗(yàn)7. 在Oracle數(shù)據(jù)庫中移動(dòng)數(shù)據(jù)文件的具體方法8. SQL語句中的ON DUPLICATE KEY UPDATE使用9. Navicat for MySQL的使用教程詳解10. Mysql入門系列:對MYSQL查詢中有疑問的數(shù)據(jù)進(jìn)行編碼
