文章詳情頁

MySQL 整體架構介紹

瀏覽：6日期：2023-10-10 15:40:01

MySQL 在整體架構上分為 Server 層和存儲引擎層。其中 Server 層，包括連接器、查詢緩存、分析器、優化器、執行器等，存儲過程、觸發器、視圖和內置函數都在這層實現。數據引擎層負責數據的存儲和提取，如 InnoDB、MyISAM、Memory 等引擎。在客戶端連接到 Server 層后，Server 會調用數據引擎提供的接口，進行數據的變更。

MySQL 整體架構介紹

連接器

負責和客戶端建立連接，獲取用戶權限以及維持和管理連接。

通過 show processlist; 來查詢連接的狀態。在用戶建立連接后，即使管理員改變連接用戶的權限，也不會影響到已連接的用戶。默認連接時長為 8 小時，超過時間后將會被斷開。

簡單說下長連接：

優勢：在連接時間內，客戶端一直使用同一連接，避免多次連接的資源消耗。

劣勢：在 MySQL 執行時，使用的內存被連接對象管理，由于長時間沒有被釋放，會導致系統內存溢出，被系統kill. 所以需要定期斷開長連接，或執行大查詢后，斷開連接。MySQL 5.7 后，可以通過 mysql_rest_connection 初始化連接資源，不需要重連或者做權限驗證。

查詢緩存

當接受到查詢請求時，會現在查詢緩存中查詢（key/value保存），是否執行過。沒有的話，再走正常的執行流程。

但在實際情況下，查詢緩存一般沒有必要設置。因為在查詢涉及到的表被更新時，緩存就會被清空。所以適用于靜態表。在 MySQL8.0 后，查詢緩存被廢除。

分析器

詞法分析：

如識別 select，表名，列名，判斷其是否存在等。

語法分析：

判斷語句是否符合 MySQL 語法。

優化器

確定索引的使用，join 表的連接順序等，選擇最優化的方案。

執行器

在具體執行語句前，會先進行權限的檢查，通過后使用數據引擎提供的接口，進行查詢。如果設置了慢查詢，會在對應日志中看到 rows_examined 來表示掃描的行數。在一些場景下（索引），執行器調用一次，但在數據引擎中掃描了多行，所以引擎掃描的行數和 rows_examined 并不完全相同。

不預先檢查權限的原因：如像觸發器等情況，需要在執行器階段才能確定權限，在優化器階段無法驗證。

使用 profiling 查看 SQL 執行過程

打開 profiling 分析語句執行過程：

mysql> select @@profiling;+-------------+| @@profiling |+-------------+| 0 |+-------------+1 row in set, 1 warning (0.00 sec)

mysql> set profiling=1;Query OK, 0 rows affected, 1 warning (0.00 sec)

執行查詢語句：

mysql> SELECT * FROM s limit 10;+------+--------+-----+-----+| s_id | s_name | age | sex |+------+--------+-----+-----+| 1 | z | 12 | 1 || 2 | s | 14 | 0 || 3 | c | 14 | 1 |+------+--------+-----+-----+3 rows in set (0.00 sec)

獲取 profiles;

mysql> show profiles;+----------+------------+--------------------------+| Query_ID | Duration | Query |+----------+------------+--------------------------+| 1 | 0.00046600 | SELECT * FROM s limit 10 |+----------+------------+--------------------------+mysql> show profile;+----------------------+----------+| Status| Duration |+----------------------+----------+| starting | 0.000069 || checking permissions | 0.000008 | 權限檢查| Opening tables | 0.000018 | 打開表| init | 0.000019 | 初始化| System lock | 0.000010 | 鎖系統| optimizing | 0.000004 | 優化查詢| statistics | 0.000013 || preparing | 0.000094 | 準備| executing | 0.000016 | 執行| Sending data | 0.000120 || end | 0.000010 || query end | 0.000015 || closing tables | 0.000014 || freeing items | 0.000032 || cleaning up | 0.000026 |+----------------------+----------+15 rows in set, 1 warning (0.00 sec)

查詢具體的語句：

mysql> show profile for query 1;+----------------------+----------+| Status| Duration |+----------------------+----------+| starting | 0.000069 || checking permissions | 0.000008 || Opening tables | 0.000018 || init | 0.000019 || System lock | 0.000010 || optimizing | 0.000004 || statistics | 0.000013 || preparing | 0.000094 || executing | 0.000016 || Sending data | 0.000120 || end | 0.000010 || query end | 0.000015 || closing tables | 0.000014 || freeing items | 0.000032 || cleaning up | 0.000026 |+----------------------+----------+15 rows in set, 1 warning (0.00 sec)

MySQL 日志模塊

如前面所說，MySQL 整體分為 Server 層和數據引擎層，而每層也對應了自己的日志文件。如果選用的是 InnoDB 引擎，對應的是 redo log 文件。Server 層則對應了 binlog 文件。至于為什么存在了兩種日志系統，咱們往下看。

redo log

redo log 是 InnoDB 特有日志，為什么要引入 redo log 呢，想象這樣一個場景，MySQL 為了保證持久性是需要把數據寫入磁盤文件的。我們知道，在寫入磁盤時，會進行文件的 IO，查找操作，如果每次更新操作都這樣的話，整體的效率就會特別低，根本沒法使用。

既然直接寫入磁盤不行，解決方法就是先寫進內存，在系統空閑時再更新到磁盤就可以了。但光更新內存不行，假如系統出現異常宕機和重啟，內存中沒有被寫入磁盤的數據就會被丟掉，數據的一致性就出現問題了。這時 redo log 就發揮了作用，在更新操作發生時，InnoDb 會先寫入 redo log 日志（記錄了數據發生了怎么樣的改變），然后更新內存，最后在適當的時間再寫入磁盤，一般是找系統空閑的時間做。先寫日志，在寫磁盤的操作，就是常說到的 WAL （Write-Ahead- Logging）技術。

redo log 的出現，除了在效率上有了很大的改善，還保證了 MySQL 具有了 crash-safe 的能力，在發生異常情況下，不會丟失數據。

在具體實現上 redo log 的大小是固定的，可配置一組為 4 個文件，每個文件 1GB，更新時對四個文件進行循環寫入。

MySQL 整體架構介紹

write pos 記錄當前寫入的位置，寫完就后移，當第寫入第 4 個文件的末尾時，從第 0 號位置重新寫入。

check point 表示當前可以擦除的位置，當數據更新到磁盤時，check point 就向后移動。

write pos 和 check point 之間的位置，就是可以記錄更新操作的空間。當 write pos 追上 check point ，不在能執行新的操作，先讓 check point 去寫入一些數據。

可以將 innodb_flush_log_at_trx_commit 設置成 1，開啟 redo log 持久化的能力。

binlog

binlog 則是 Server 層的日志，主要用于歸檔，在備份，主備同步，恢復數據時發揮作用，常見的日志格式有 row, mixed, statement 三種。具體的使用方法可以參見 Binlog 恢復日志這篇。

可以通過 sync_binlog=1 開啟 binlog 寫入磁盤。

這里對 binlog 和 redo 進行下區分：

所有者不同，binlog 是 Server 層，所有引擎都可使用。redo log 是 InnoDB 特有的。類型不同，binlog 是邏輯日志，記錄的是語句的原始邏輯（比 statement）。redo log 是物理日志，記錄某個數據頁被做了怎樣的修改。數據寫入的方式不同，binog 日志會一直追加，而 redo log 是循環寫入。功能不同，binlog 用于歸檔，而 redo log 用于保證 crash-safe.

兩階段提交

下面執行器和 InnoDB 執行 Update 時內部流程：

以更新 update T set c=c+1 where ID=2; 語句為例：

執行器通過 InooDB 引擎去 ID 所在行，ID 為主鍵。引擎通過樹搜索找到該行，如果該行所在數據頁在內存中，返回給執行器。否則先從磁盤讀入內存，然后再返回。執行器拿到引擎給的數據，將 C 值加 1，等到新的一行，然后通過引擎接口重新寫入新數據。引擎將該行更新到內存中，同時將該更新操作記錄到 redo log 中，并更改 redo log 的狀態為 prepare 狀態。然后告知執行器，在合適的時間提交事務。執行器生成這個操作的 binlog，并將 binlog 寫入磁盤。執行器調用引擎到的提交事務接口，將剛剛寫入的 redo log 改成 commit 狀態，更新完成。

MySQL 整體架構介紹

淺色為執行器執行，深色為引擎執行。

在更新內存后，將寫入 redo log 拆分了成兩個步驟：prepare 和 commit，就是常說的兩階段提交。用于保證當有意外情況發生時，數據的一致性。

這里假設下，如果不采用兩階段提交會發生什么？

先寫 redo log 后寫 binlog. 假設在寫入 redo log 后，MySQL 發生異常重啟，此時 binlog 沒有寫入。在重啟后，由于 redolog 已經寫入，此時數據庫的內容是沒有問題的。但此時，如果想要拿 binlog 進行備份或恢復，發現會少了最后一條的更新邏輯，導致數據不一致。先寫 binlog 后寫 redo log. binlog 寫入后，MySQL 異常重啟，redo log 沒有寫入。此時重啟后，發現 redo log 沒有成功寫入，認為這個事務無效，而此時 binlog 卻多了一條更新語句，拿去恢復后自然數據也是不一致的。

再分析下兩階段提交的過程：

1.在寫 redo log prepare 階段奔潰，時刻 A 的位置。重啟后，發現 redo log 沒寫入，回滾此次事務。

2.如果在寫 binlog 時奔潰，重啟后，發現 binlog 未被寫入，回滾操作。

3.binlog 寫完，但在提交 redo log 的 commit 狀態時發生 crash

如果 redo log 中事務完整，有了 commit 標識，直接提交。如果 redo log 中只有完整的 prepare, 判斷對應 binlog 是否完整。

完整，提交事務不完整，回滾事務。

如何判斷 binlog 是否完整？

statement 格式 binlog，會有 COMMIT; 標識 row 格式的 binlog，會有 XID event. 標識在 5.6 后，還有 binlog-checksum 參數，驗證 binlog 正確性。

如何將 redo log 和 binlog 關聯表示同一個操作？

結構中有一個共同的數據字段，XID. 在崩潰恢復時，會按順序掃描 redo log:

如果有 prepare，又有 commit 的 redo log，直接提交。如果只有 prepare，沒有 commit 的 redo log, 拿 XID 去 binlog 找對應的事務做判斷。

數據寫入后，最終落盤和 redo log 有無關系？

對于正常運行的 instance 來說，內存中頁被修改后，和磁盤的數據頁不一致，稱為臟頁。而落盤的過程，是把內存中的數據頁寫入磁盤。對于 crash 場景，InnoDB 判斷一個數據頁是否丟失了更新，會將其讀到內存，然后讓 redo log 更新內存內容。更新完成后，內存頁就變成臟頁，然后回到第一種情況的狀態。

redo log buffer 和 redo log 的關系？

在一個事務的更新過程中，存在多個 SQL 語句，所以是要寫多次日志的。但在寫的過程中，生產的日志要先保存起來，但在 commit 前，不能直接寫到 redo log 中。所以通過內存中 redo log buffer 先存 redo log 的日志。在 commit 時，將 buffer 中的內容寫入 redo log.

總結

在文章開始部分，說明了 MySQL 的整體架構分為 Server 層和引擎層，并簡要說明了一條語句的執行過程。接著 MySQL 在 5.5 后選用 InnoDB 作為默認的引擎，就是因為比原生的 MyISAM 多了事務以及 crash-safe 的能力。

而 crash-safe 就是由 redo log 實現的。與 redo log 類似的日志文件還有 binlog，是 Server 引擎的日志，用于歸檔和備份數據。

最后提到了，為了保證數據的一致性，將 redo log 和 binlog 放入相同的事務中，也就是常提到的兩階段提交操作。

以上就是MySQL 整體架構介紹的詳細內容，更多關于MySQL 整體架構的資料請關注好吧啦網其它相關文章！

上一條：MySQL選錯索引的原因以及解決方案下一條：MySQL性能突然下降的原因

相關文章：

1. DB2的高可用性和災難恢復概述2. Microsoft Office Access添加外鍵的方法3. MySQL深分頁問題原理與三種解決方案4. 淺談Mybatis+mysql 存儲Date類型的坑5. golang中連接mysql數據庫6. MySQL單表千萬級數據處理的思路分享7. 關于DB2數據庫的系統信息集成（1）8. SQL實現模糊查詢的四種方法總結9. sqlserver給表添加新字段、給表和字段添加備注、更新備注及查詢備注(sql語句)10. 記一次mariadb數據庫無法連接

排行榜

					
					DB2的高可用性和災難恢復概述
Microsoft Office Access添加外鍵的方法
淺談Mybatis+mysql 存儲Date類型的坑
SQL實現模糊查詢的四種方法總結
關于DB2數據庫的系統信息集成（1）
MySQL深分頁問題原理與三種解決方案
golang中連接mysql數據庫
MySQL單表千萬級數據處理的思路分享
記一次mariadb數據庫無法連接
sqlserver給表添加新字段、給表和字段添加備注、更新備注及查詢備注(sql語句)
Microsoft Office Access添加圖片的方法
				

熱門標簽

久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

MySQL 整體架構介紹