文章詳情頁(yè)

淺談MySQL如何優(yōu)雅的做大表刪除

瀏覽：12日期：2023-10-04 11:32:28

隨著時(shí)間的推移或者業(yè)務(wù)量的增長(zhǎng)，數(shù)據(jù)庫(kù)空間使用率也不斷的呈穩(wěn)定上升狀態(tài)，當(dāng)數(shù)據(jù)庫(kù)空間將要達(dá)到瓶頸的時(shí)候，可能我們才會(huì)發(fā)現(xiàn)數(shù)據(jù)庫(kù)有那么一兩張的超級(jí)大表！他們堆積了從業(yè)務(wù)開(kāi)始到現(xiàn)在的全部數(shù)據(jù)，但是90%的數(shù)據(jù)都是沒(méi)有業(yè)務(wù)價(jià)值的，這時(shí)候該如何處理這些大表？

既然是沒(méi)有價(jià)值的數(shù)據(jù)，我們通常一般會(huì)選擇直接刪除或者歸檔后刪除兩種，對(duì)于數(shù)據(jù)刪除的操作方式來(lái)說(shuō)又可分為兩大類(lèi)：

通過(guò)truncate直接刪除表中全部數(shù)據(jù) 通過(guò)delete刪除表中滿(mǎn)足條件記錄一、Truncate操作

從邏輯意義上來(lái)講，truncate操作就是刪除表中所有記錄行，但是又與delete from table_name wehre 1=1這種操作不一樣。MySQL為了提高刪除整張表數(shù)據(jù)的性能，truncate操作其本質(zhì)上其實(shí)是先drop table然后在re-create table。也真因如此，truncate操作是一個(gè)不可回滾的DDL操作。

1.1 MySQL truncate 都做了哪些操作？ truncate操作實(shí)際上分為drop、re-create兩步 drop操作的第一個(gè)階段，是對(duì)Buffer pool頁(yè)面進(jìn)行清除的過(guò)程，將表相關(guān)的數(shù)據(jù)頁(yè)從flush鏈中刪除，而不需要做flush操作。該步驟的瓶頸點(diǎn)主要在于flush隊(duì)列的刪除操作必須持有對(duì)應(yīng)buffer pool instance的鎖并進(jìn)行遍歷搜索，如果buffer pool instance比較大且flush鏈中需要?jiǎng)h除的數(shù)據(jù)頁(yè)很多，該操作會(huì)導(dǎo)致其他事務(wù)在獲取buffer pool instance的鎖時(shí)被阻塞，從而影響數(shù)據(jù)庫(kù)的性能 drop操作的第二個(gè)階段，是刪除ibd磁盤(pán)文件的過(guò)程。刪除數(shù)據(jù)庫(kù)物理文件越大I/O資源消耗越大，刪除操作耗時(shí)越久 re-create操作階段，只要?jiǎng)h除表的.frm文件完好無(wú)損，在drop table之后就可以按照原表結(jié)構(gòu)信息進(jìn)行重建，重建后表的auto_increment值會(huì)被重置1.2 如何優(yōu)化truncate操作帶來(lái)的資源消耗？對(duì)于truncate操作中的drop表第一階段，當(dāng)分配給MySQL實(shí)例的innodb_buffer_pool_size超過(guò)1GB時(shí)，合理的設(shè)置innodb_buffer_pool_instances參數(shù)，提高并發(fā)的同時(shí)也變相的減少掃描buffer pool instance時(shí)鎖資源占用耗時(shí) 對(duì)于truncate操作中的drop表第二階段，在刪除對(duì)應(yīng)表之前，先對(duì)改表的.ibd文件創(chuàng)建一個(gè)硬連接，加快MySQL層面的drop操作執(zhí)行效率，減少對(duì)數(shù)據(jù)庫(kù)層面的性能損耗。后續(xù)手動(dòng)對(duì)操作系統(tǒng)層面我們做的硬連接進(jìn)行清理二、Delete操作2.1 MySQL delete 都做了哪些操作？根據(jù)where條件對(duì)刪除表進(jìn)行索引/全表掃描，檢查是否符合where條件，該階段會(huì)對(duì)掃描中所有行進(jìn)行加鎖。該階段是最大的資源消耗隱患，若表的數(shù)據(jù)量大且delete操作無(wú)法有效利用索引減少掃描數(shù)據(jù)量，該步驟對(duì)于數(shù)據(jù)庫(kù)帶來(lái)的鎖爭(zhēng)用、cpu/io資源的消耗都是巨大的對(duì)不能夠被where條件匹配的行施加的鎖會(huì)在條件檢查后予以釋放，InnoDB僅鎖定需要?jiǎng)h除的行。這可以有效地降低鎖爭(zhēng)用，但是我們?nèi)孕枰P(guān)注的一點(diǎn)是，一次性刪除大批量的數(shù)據(jù)，該操作將會(huì)產(chǎn)生巨大的binlog事務(wù)日志，這對(duì)于MySQL自身以及主從架構(gòu)中的從庫(kù)都是不友好的，可能帶來(lái)叫的復(fù)制延遲。2.2 如何優(yōu)化delete操作？ delete全表刪除操作需要謹(jǐn)慎，可考慮使用truncate操作 delete … where … 中，where過(guò)濾條件盡量保證可有效利用索引減少數(shù)據(jù)掃描量，避免全表掃描對(duì)于大批量數(shù)據(jù)刪除且where條件無(wú)索引的情況，delete操作可額外增加自增長(zhǎng)主鍵或者含索引的時(shí)間字段，進(jìn)行分批刪除操作，每次刪除少量數(shù)據(jù)，分多批次執(zhí)行。對(duì)于保留近期數(shù)據(jù)刪除歷史數(shù)據(jù)的經(jīng)典場(chǎng)景，可創(chuàng)建同結(jié)構(gòu)的xxx_tmp表并通過(guò)insert xxx_tmp select …操作將需要的數(shù)據(jù)保留至tmp表中、然后通過(guò)rename操作將當(dāng)前業(yè)務(wù)表xxx替換為xxx_bak表，xxx_tmp表替換為當(dāng)前業(yè)務(wù)表名xxx，后續(xù)手動(dòng)刪除無(wú)用的大表xxx_bak2.3 delete常見(jiàn)的兩個(gè)場(chǎng)景

2.3.1 delete where條件無(wú)有效索引過(guò)濾

比較常見(jiàn)的一個(gè)場(chǎng)景是，業(yè)務(wù)上需要?jiǎng)h除t1 condition1=xxx的值，condition字段無(wú)法有效利用索引，這種情況下我們通常的做法是：

查看當(dāng)前表結(jié)構(gòu)中可有效利用的索引，盡量是表的自增長(zhǎng)主鍵或者時(shí)間索引字段有效利用自增長(zhǎng)主鍵索引或者時(shí)間索引，將delete操作添加索引字段的范圍過(guò)濾，每次刪除少量數(shù)據(jù)，分多批次執(zhí)行。具體分批需要根據(jù)業(yè)務(wù)實(shí)際進(jìn)行評(píng)估，避免一次性刪除大批量數(shù)據(jù)。

-- 利用自增長(zhǎng)主鍵索引delete from t1 where condition1=xxx and id >=1 and id < 50000;delete from t1 where condition1=xxx and id >=50000 and id < 100000;-- 利用時(shí)間索引delete from t1 where condition1=xxx and create_time >= ’2021-01-01 00:00:00’ and create_time < ’2021-02-01 00:00:00’;delete from t1 where condition1=xxx and create_time >= ’2021-02-01 00:00:00’ and create_time < ’2021-03-01 00:00:00’;

2.3.2 保留近期數(shù)據(jù)刪除歷史數(shù)據(jù)

比較常見(jiàn)的一個(gè)場(chǎng)景是，需要僅保留t1表近3個(gè)月數(shù)據(jù)，其余歷史數(shù)據(jù)刪除，我們通常的做法是：

創(chuàng)建一張t1_tmp表用來(lái)臨時(shí)存儲(chǔ)需要保留的數(shù)據(jù)

create table t1_tmp like t1;

根據(jù)有索引的時(shí)間字段，分批次的將需要保留的數(shù)據(jù)寫(xiě)入t1_tmp表中，該步驟需要注意的是，最后一批次時(shí)間的操作可暫時(shí)不處理

-- 根據(jù)實(shí)例業(yè)務(wù)數(shù)量進(jìn)行分批，盡量每批次處理數(shù)據(jù)量不要太大insert into t1_tmp select * from t1 where create_time >= ’2021-01-01 00:00:00’ and create_time < ’2021-02-01 00:00:00’;insert into t1_tmp select * from t1 where create_time >= ’2021-02-01 00:00:00’ and create_time < ’2021-03-01 00:00:00’;-- 當(dāng)前最后一批次數(shù)據(jù)先不操作-- insert into t1_tmp select * from t1 where create_time >= ’2021-03-01 00:00:00’ and create_time < ’2021-04-01 00:00:00’;

通過(guò)rename操作將當(dāng)前業(yè)務(wù)表t1替換為t1_bak表，t1_tmp表替換為當(dāng)前業(yè)務(wù)表名t1，被刪除表若有頻繁的DML操作，該步驟會(huì)造成短暫的業(yè)務(wù)訪問(wèn)失敗

alter table t1 rename to t1_bak;alter table t1_tmp rename to t1;

將最后一批次數(shù)據(jù)寫(xiě)入當(dāng)前業(yè)務(wù)表，該步驟的目的是為了減少變更操作流程中的數(shù)據(jù)丟失

insert into t1 select * from t1_bak where create_time >= ’2021-03-01 00:00:00’ and create_time < ’2021-04-01 00:00:00’;

在rename操作步驟中，還有一點(diǎn)我們需要關(guān)注的是，變更表主鍵是自增長(zhǎng)還是業(yè)務(wù)唯一的uuid，若為自增長(zhǎng)主鍵，我們還需要注意修改t1_tmp表的自增長(zhǎng)值，保證最終設(shè)置值包含變更期間數(shù)據(jù)寫(xiě)入

alter table t1_tmp auto_increment={t1表當(dāng)前auto值}+{變更期間預(yù)估增長(zhǎng)值}三、Truncate/Delete優(yōu)劣勢(shì)對(duì)比

操作類(lèi)型描述優(yōu)勢(shì) 劣勢(shì) Truncate 表的全量刪除操作無(wú)需掃描表數(shù)據(jù)，執(zhí)行效率高，直接進(jìn)行物理刪除，快速釋放空間占用 DDL操作無(wú)法進(jìn)行回滾,無(wú)法按條件進(jìn)行刪除 Delete 根據(jù)指定條件進(jìn)行過(guò)濾刪除操作可根據(jù)指定條件進(jìn)行過(guò)濾刪除刪除效率依賴(lài)where條件的編寫(xiě)，大表刪除會(huì)產(chǎn)品大量的binlog且刪除效率低，刪除操作可能出現(xiàn)較多的碎片空間而不是直接釋放空間占用

到此這篇關(guān)于淺談MySQL如何優(yōu)雅的做大表刪除的文章就介紹到這了,更多相關(guān)MySQL 大表刪除內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)！

上一條：MySQL too many connections錯(cuò)誤的原因及解決下一條：MySQL中冗余和重復(fù)索引的區(qū)別說(shuō)明

相關(guān)文章：

1. Mysql入門(mén)系列：MYSQL列類(lèi)型選擇與MYSQL查詢(xún)效率2. MySQL慢查詢(xún)以及解決方案詳解3. SQL Server數(shù)據(jù)庫(kù)開(kāi)發(fā)之觸發(fā)器的實(shí)際應(yīng)用4. Oracle 數(shù)據(jù)庫(kù)集中復(fù)制方法逐步精細(xì)5. 用腳本和查詢(xún)主動(dòng)監(jiān)視Oracle 9i性能6. Oracle 10g DBMS_SCHEDULER的中度解析7. 整理Oracle數(shù)據(jù)庫(kù)碎片8. 傳甲骨文將增加對(duì)MySQL投資與微軟競(jìng)爭(zhēng)9. Oracle取整函數(shù)用法案例10. Oracle數(shù)據(jù)庫(kù)物理文件大小的限制簡(jiǎn)介

排行榜

					
					SQL Server數(shù)據(jù)庫(kù)開(kāi)發(fā)之觸發(fā)器的實(shí)際應(yīng)用
Mysql入門(mén)系列：MYSQL列類(lèi)型選擇與MYSQL查詢(xún)效率
用腳本和查詢(xún)主動(dòng)監(jiān)視Oracle 9i性能
傳甲骨文將增加對(duì)MySQL投資與微軟競(jìng)爭(zhēng)
整理Oracle數(shù)據(jù)庫(kù)碎片
MySQL慢查詢(xún)以及解決方案詳解
Oracle 10g DBMS_SCHEDULER的中度解析
Oracle 數(shù)據(jù)庫(kù)集中復(fù)制方法逐步精細(xì)
Oracle數(shù)據(jù)庫(kù)優(yōu)化及其應(yīng)用程序研究
Oracle數(shù)據(jù)庫(kù)物理文件大小的限制簡(jiǎn)介
Mysql入門(mén)系列：在MYSQL結(jié)果集上執(zhí)行計(jì)算
				

久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

淺談MySQL如何優(yōu)雅的做大表刪除