Chapter 15. Storage Engines and Table Types

第15章：儲存引擎和資料表類型

MySQL支援數個儲存引擎作為對不同資料表的類型的處理器。MySQL儲存引擎包括處理事務安全資料表的引擎和處理非事務安全資料表的引擎：

· MyISAM管理非事務資料表。它提供高速儲存和檢索，以及全文搜索能力。MyISAM在所有MySQL配置裡被支援，它是預設的儲存引擎，除非您配置MySQL預設使用另外一個引擎。

· MEMORY儲存引擎提供「內存中」資料表。MERGE儲存引擎允許集合將被處理同樣的MyISAM資料表作為一個單獨的資料表。就像MyISAM一樣，MEMORY和MERGE儲存引擎處理非事務資料表，這兩個引擎也都被預設包含在MySQL中。

註釋：MEMORY儲存引擎正式地被確定為HEAP引擎。

· InnoDB和BDB儲存引擎提供事務安全資料表。BDB被包含在為支援它的作業系統發佈的MySQL-Max二進制分發版裡。InnoDB也預設被包括在所有MySQL 5.1二進制分發版裡，您可以按照喜好通過配置MySQL來允許或禁止任一引擎。

· EXAMPLE儲存引擎是一個“存根”引擎，它不做什麼。您可以用這個引擎建立資料表，但沒有數據被儲存於其中或從其中檢索。這個引擎的目的是服務，在MySQL源代碼中的一個例子，它演示說明如何開始編寫新儲存引擎。同樣，它的主要興趣是對開發者。

· NDB Cluster是被MySQL Cluster用來實現分割到多台計算機上的資料表的儲存引擎。它在MySQL-Max 5.1二進制分發版裡提供。這個儲存引擎當前只被Linux, Solaris, 和Mac OS X 支援。在未來的MySQL分發版中，我們想要新增其它平台對這個引擎的支援，包括Windows。

· ARCHIVE儲存引擎被用來無索引地，非常小地覆蓋儲存的大量數據。

· CSV儲存引擎把數據以逗號分隔的格式儲存在文本檔案中。

· BLACKHOLE儲存引擎接受但不儲存數據，並且檢索總是返回一個空集。

· FEDERATED儲存引擎把數據存在遠程資料庫中。在MySQL 5.1中，它只和MySQL一起工作，使用MySQL C Client API。在未來的分發版中，我們想要讓它使用其它驅動器或客戶端連接方法連接到另外的數據源。

尋求選擇一個儲存引擎的幫助，請參閱14.4節，「選擇一個儲存引擎”。

這一章講述除NDB Cluster外的每一個MySQL儲存引擎，NDB Cluster在第17章：MySQL Cluster中介紹。

當年建立一個新資料表的時候，您可以通過新增一個ENGINE 或TYPE 選項到CREATE TABLE語句來告訴MySQL您要建立什麼類型的資料表：

CREATE TABLE t (i INT) ENGINE = INNODB;

CREATE TABLE t (i INT) TYPE = MEMORY;

雖然TYPE仍然在MySQL 5.1中被支援，現在ENGINE是首選的術語。

如果您省略掉ENGINE或TYPE選項，預設的儲存引擎被使用。一般的預設是MyISAM，但您可以用--default-storage-engine或--default-table-type伺服器啟動選項來改變它，或者通過設置storage_engine或table_type系統變數來改變。

當MySQL被用MySQL配置嚮導安裝在Windows平台上，InnoDB儲存引擎替代MyISAM儲存引擎作為替代，請參閱2.3.5.1節，「介紹”。

要把一個資料表從一個類型轉到另一個類型，可使用ALTER TABLE語句，這個語句指明新的類型：

ALTER TABLE t ENGINE = MYISAM;

ALTER TABLE t TYPE = BDB;

請參閱13.1.5節，「CREATE TABLE語法”和13.1.2節，「ALTER TABLE語法”。

如果您試著使用一個未被編譯進MySQL的儲存引擎，或者試著用一個被編譯進MySQL但沒有被激活的儲存引擎，MySQL取而代之地建立一個MyISAM類型的資料表。當您在支援不同儲存引擎的MySQL伺服器之間拷貝資料表的時候，上述的行為是很方便的。（例如，在一個複製建立中，可能您的主伺服器為增加安全而支援事務儲存引擎，但從伺服器為更快的速度而僅使用非事務儲存引擎。)

在不可用的類型被指定時，自動用MyISAM資料表來替代，這會對MySQL的新用戶造成混淆。無論何時一個資料表被自動改變之時，產生一個警告。

MySQL總是建立一個.frm檔案來保持資料表和列的定義。資料表的索引和數據可能被儲存在一個或多個檔案裡，這取決於資料表的類型。伺服器在儲存引擎級別之上建立.frm檔案。單獨的儲存引擎建立任何需要用來管理資料表的額外檔案。

一個資料庫可以包含不同類型的資料表。

事務安全資料表(TST) 比起非事務安全資料表 (NTST)有幾大優勢：

· 更安全。即使MySQL崩潰或遇到硬件問題，要麼自動恢復，要麼從備份加事務日誌恢復，您可以取回數據。

· 您可以合併許多語句，並用COMMIT語句同時接受它們全部（如果autocommit被禁止掉）。

· 您可以執行ROLLBACK來忽略您的改變（如果autocommit被禁止掉）。

· 如果更新失敗，您的所有改變都變回原來。（用非事務安全資料表，所有發生的改變都是永久的）。

· 事務安全儲存引擎可以給那些當前用讀得到許多更新的資料表提供更好的部署。

雖然MySQL支援數個事務安全儲存引擎，為獲得最好結果，您不應該在一個事務那混合不同資料表類型。如果您混合資料表類型會發生問題，更多訊息請參閱13.4.1節，「START TRANSACTION, COMMIT和ROLLBACK Syntax”。

如果您沒有指定配置值的話，InnoDB使用預設的配置值。請參閱15.2.3節，「InnoDB配置”。

非事務安全資料表自身有幾個優點，因為沒有事務開支，所有優點都能出現：

· 更快

· 需要更少的磁盤空間

· 執行更新需要更少的內存

您可以在同一個語句中合併事務安全和非事務安全資料表來獲得兩者最好的情況。儘管如此，在autocommit被禁止掉的事務裡，變換到非事務安全資料表依舊即時提交，並且不會被回滾。

15.1. MyISAM儲存引擎

15.1.1. MyISAM啟動選項

15.1.2.鍵需要的空間

15.1.3. MyISAM資料表儲存格式

15.1.4. MyISAM資料表的問題

MyISAM是預設儲存引擎。它基於更老的ISAM代碼，但有很多有用的延伸。（注意MySQL 5.1不支援ISAM）。

每個MyISAM在磁盤上儲存成三個檔案。第一個檔案的名字以資料表的名字開始，延伸名指出檔案類型。.frm檔案儲存資料表定義。數據檔案的延伸名為.MYD (MYData)。索引檔案的延伸名是.MYI (MYIndex)。

要明確資料表示您想要用一個MyISAM資料表格，請用ENGINE資料表選項指出來：

CREATE TABLE t (i INT) ENGINE = MYISAM;

註釋：老版本的MySQL使用TYPE而不是ENGINE（例如，TYPE = MYISAM）。MySQL 5.1為向下兼容而支援這個語法，但TYPE現在被輕視，而ENGINE是首先的用法。

一般地，ENGINE選項是不必要的；除非預設已經被改變了，MyISAM是預設儲存引擎。

您可以用myisamchk工具來檢查或修復MyISAM資料表。請參閱5.9.5.6節，「使用myisamchk做崩潰恢復”。您也可以用myisampack來壓縮MyISAM資料表，讓它們占更少的空間。請參閱8.2節，「myisampack，產生壓縮、只讀的MyISAM資料表”。

如下是MyISAM儲存引擎的一些特徵：

· 所有數據值先儲存低字節。這使得數據機和作業系統分離。二進制輕便性的唯一要求是機器使用補碼（如最近20年的機器有的一樣）和IEEE浮點格式（在主流機器中也完全是主導的）。唯一不支援二進制相容性的機器是嵌入式系統。這些系統有時使用特殊的處理器。

先儲存數據低字節並不嚴重地影響速度；數據行中的字節一般是未聯合的，從一個方向讀未聯合的字節並不比從反向讀更佔用更多的資源。伺服器上的獲取列值的代碼與其它代碼相比並不顯得時間緊。

· 大檔案（達63位檔案長度）在支援大檔案的檔案系統和作業系統上被支援。

· 當把刪除和更新及插入混合的時候，動態尺寸的行更少碎片。這要通過合併相鄰被刪除的塊，以及若下一個塊被刪除，就延伸到下一塊來自動完成。

· 每個MyISAM資料表最大索引數是64。這可以通過重新編譯來改變。每個索引最大的列數是16個。

· 最大的鍵長度是1000字節。這也可以通過編譯來改變。對於鍵長度超過250字節的情況，一個超過1024字節的的鍵塊被用上。

· BLOB和TEXT列可以被索引。

· NULL值被允許在索引的列中。這個占每個鍵的0-1個字節。

· 所有數字鍵值以高字節為先被儲存以允許一個更高地索引壓縮。

· 當記錄以排好序的順序插入（就像您使用一個AUTO_INCREMENT列之時），索引樹被劈開以便高節點僅包含一個鍵。這改善了索引樹的空間利用率。

· 每資料表一個AUTO_INCREMEN列的內部處理。MyISAM為INSERT和UPDATE操作自動更新這一列。這使得AUTO_INCREMENT列更快（至少10%）。在序列頂的值被刪除之後就不能再利用。（當AUTO_INCREMENT列被定義為多列索引的最後一列，可以出現重使用從序列頂部刪除的值的情況）。AUTO_INCREMENT值可用ALTER TABLE或myisamch來重置。

· 如果數據檔案中間的資料表沒有自由塊了，在其它線程從資料表讀的同時，您可以INSERT新行到資料表中。（這被認識為並發操作）。自由塊的出現是作為刪除行的結果，或者是用比當前內容多的數據對動態長度行更新的結果。當所有自由塊被用完（填滿），未來的插入又變成並發。

· 您可以把數據檔案和索引檔案放在不同目錄，用DATA DIRECTORY和INDEX DIRECTORY選項CREATE TABLE以獲得更高的速度，請參閱13.1.5節，「CREATE TABLE語法”。

· 每個字元列可以又不同的字元編碼，請參閱第10章：「字元編碼支援」。

· 在MyISAM索引檔案裡又一個標誌，它表明資料表是否被正確關閉。如果用--myisam-recover選項啟動mysqld，MyISAM資料表在打開得時候被自動檢查，如果被資料表被不恰當地關閉，就修復資料表。

· 如果您用--update-state選項運行myisamchk，它標注資料表為已檢查。myisamchk --fast只檢查那些沒有這個標誌的資料表。

· myisamchk --analyze為部分鍵儲存統計訊息，也為整個鍵儲存統計訊息。

· myisampack可以打包BLOB和VARCHAR列。

MyISAM也支援下列特徵：

· 支援true VARCHAR類型；VARCHAR列以儲存在2個字節中的長度來開始。

· 有VARCHAR的資料表可以有固定或動態記錄長度。

· VARCHAR和CHAR列可以多達64KB。

· 一個被搞亂的已計算索引對可對UNIQUE來使用。這允許您在資料表內任何列的合併上有UNIQUE。（儘管如此，您不能在一個UNIQUE已計算索引上搜索）。

對MyISAM儲存引擎，有一個更詳細的論壇在http://forums.mysql.com/list.php?21。

15.1.1. MyISAM啟動選項

下列對mysqld 的選項可用來改變MyISAM資料表的行為：

· --myisam-recover=mode

設置為崩潰MyISAM資料表自動恢復的模式。

· --delay-key-write=ALL

對任何MyISAM資料表的寫操作之間不要刷新鍵緩衝區。

註釋：如果您要這麼做。當資料表在使用中之時，您應該不使用來自另一個程式的MyISAM資料表（比如從另一個MySQL伺服器或用myisamchk）。這麼做會導致索引被破壞。

對使用--delay-key-write的資料表，使用--external-locking沒有幫助。

請參閱5.3.1節，「mysqld命令行選項”。

下列系統變數影響MyISAM資料表的行為：

· bulk_insert_buffer_size

用在塊插入最佳化中的樹緩衝區的大小。註釋：這是一個per thread的限制。

· (OBSOLETE) myisam_max_extra_sort_file_size

這個參數已經不在MySQL中使用。

· myisam_max_sort_file_size

如果臨時檔案會變得超過索引，不要使用快速排序索引方法來建立一個索引。註釋：這個參數以字節的形式給出。

· myisam_sort_buffer_size

設置恢復資料表之時使用的緩衝區的尺寸。

請參閱5.3.3節，「伺服器系統變數”。

如果用--myisam-recover選項啟動mysqld，自動恢復被激活。在這種情況下，當伺服器打開一個MyISAM資料表之時，伺服器會檢查是否資料表被標注為崩潰，或者資料表的打開計數變數是否不為0且您正用--skip-external-locking運行伺服器。如果這些條件的任何一個為真，下列情況發生：

· 資料表被查錯。

· 如果伺服器發現一個錯誤，它試著做快速資料表修復（排序且不重新建立數據檔案）。

· 如果修復因為數據檔案中的一個錯誤而失敗（例如，一個重複鍵錯誤），伺服器會再次嘗試修復，這一次重建數據檔案。

· 如果修復仍然失敗，伺服器用舊修復選項方法再重試一次修復（一行接一行地寫，不排序）。這個方法應該能修復任何類型的錯誤，並且需要很低的磁盤空間。

如果恢復不能夠從先前完成的語句裡恢復所有行，而且您不能在--myisam-recover選項值指定FORCE，自動修復會終止，並在錯誤日誌裡寫一條錯誤訊息：

Error: Couldn't repair table: test.g00pages

如果您指定FORCE，取而代之地，類似這樣的一個警告被給出：

Warning: Found 344 of 354 rows when repairing ./test/g00pages

註釋：如果自動恢復值包括BACKUP，恢復程序建立檔案並用tbl_name-datetime.BAK形式取名。您應該有一個cron指令，它自動把這些檔案從資料庫目錄移到備份媒質上。

15.1.2.鍵所需的空間

MyISAM資料表使用B型樹索引。您可以粗略地計算索引檔案的大小為(key_length+4)/0.67, 加上所有的鍵之和。當所有鍵以排序的順序插入並且資料表沒有任何壓縮的鍵之時，以上估計是對最壞的情況的。

字串索引是被空間壓縮的。如果第一個字串索引部分是字串，它也被加前綴壓縮。如果字串列有許多拖曳空間，或字串列是一個總是不用完全長度的VARCHAR列，空間壓縮使得索引檔案比最壞情況時的數值要小。前綴壓縮被用在以字串開始的鍵上。如果有許多具有同一前綴的字串，前綴壓縮是有幫助的。

在MyISAM資料表，您也可以在建立資料表的時候通過指定PACK_KEYS=1來前綴壓縮數字。當數字被以高字節優先儲存之時，若您有許多具有同一前綴的整數鍵，上述方法是有幫助的。

15.1.3. MyISAM資料表的儲存格式

15.1.3.1. 靜態（固定長度）資料表特徵

15.1.3.2. 動態資料表特徵

15.1.3.3. 已壓縮資料表特徵

MyISAM支援三種不同儲存格式。其中兩個（固定格式和動態格式)根據正使用的列的類型來自動選擇。第三個，即已壓縮格式，只能使用myisampack工具來建立。

當您CREATE或ALTER一個沒有BLOB或TEXT列的資料表，您可以用ROW_FORMAT資料表選項強製表的格式為FIXED或DYNAMIC。這會導致CHAR和VARCHAR列因FIXED格式變成CHAR，或因DYNAMIC格式變成VARCHAR。

通過用ALTER TABLE指定ROW_FORMAT={COMPRESSED | DEFAULT}，您可以壓縮或解壓縮資料表，請參閱13.1.5節，「CREATE TABLE語法”。

15.1.3.1. 靜態（固定長度）資料表特徵

靜態格式是MyISAM資料表的預設儲存格式。當資料表不包含變數長度列（VARCHAR, BLOB, 或TEXT）時，使用這個格式。每一行用固定字節數儲存。

MyISAM的三種儲存格式中，靜態格式就最簡單也是最安全的（至少對於崩潰而言）。靜態格式也是最快的on-disk格式。快速來自於數據檔案中的行在磁盤上被找到的容易方式：當按照索引中的行號搜尋一個行時，用行長度乘以行號。同樣，當掃瞄一個資料表的時候，很容易用每個磁盤讀操作讀一定數量的記錄。

當MySQL伺服器正往一個固定格式MyISAM檔案寫的時候，如果計算機崩潰了，安全是顯然的。在這種情況下，myisamchk可以容易地決定每行從哪裡開始到哪裡結束，所以它通常可以收回所有記錄，除了寫了一部分的記錄。注意，基於數據行，MyISAM資料表索引可以一直被重新構建。

靜態格式資料表的一般特徵：

· CHAR列對列寬度是空間填補的。

· 非常快。

· 容易緩存。

· 崩潰後容易重建，因為記錄位於固定位置。

· 重新組織是不必要的，除非您刪除巨量的記錄並且希望為作業系統騰出磁盤空間。為此，可使用OPTIMIZE TABLE或者myisamchk -r。

· 通常比動態格式資料表需要更多的磁盤空間。

15.1.3.2. 動態資料表特徵

如果一個MyISAM資料表包含任何可變長度列（VARCHAR, BLOB或TEXTDynamic），或者如果一個資料表被用ROW_FORMAT=DYNAMIC選項來建立，動態儲存格式被使用。

這個格式更為複雜一點，因為每行有一個表明行有多長的頭。當一個記錄因為更新的結果被變得更長，該記錄也可以在超過一個位置處結束。

您可以使用OPTIMIZE TABLE或myisamchk來對一個資料表整理碎片。如果在一個資料表中有您頻繁訪問或改變的固定長度列，資料表中也有一些可變長度列，僅為避免碎片而把這些可變長度列移到其它資料表可能是一個好主意。

動態格式資料表的一般特徵：

· 除了長度少於4的列外，所有的字串列是動態的。

· 在每個記錄前面是一個位圖，該位圖表明哪一列包含空字串（對於字串列）或者0（對於數字列）。注意，這並不包括包含NULL值的列。如果一個字元列在拖曳空間移除後長度為零，或者一個數字列為零值，這都在位圖中標注了且列不被保存到磁盤。非空字串被存為一個長度字節加字串的內容。

· 通常比固定長度資料表需要更少的磁盤空間。

· 每個記錄僅使用必需大小的空間。儘管如此，如果一個記錄變大，它就按需要被分開成多片，造成記錄碎片的後果。比如，您用延伸行長度的訊息更新一行，該行就變得有碎片。在這種情況下，您可以時不時運行OPTIMIZE TABLE或myisamchk -r來改善性能。可使用myisamchk -ei來獲取資料表的統計數據。

· 動態格式資料表在崩潰後要比靜態格式資料表更難重建，因為一個記錄可能被分為多個碎片且連結（碎片）可能被丟失。

· 動態尺寸記錄期望的行長度用下列資料表達式來計算：

·                3

·                + (number of columns + 7) / 8

·                + (number of char columns)

·                + (packed size of numeric columns)

·                + (length of strings)

·                + (number of NULL columns + 7) / 8

對每個連結需要額外的6字節。在一個更新導致一個記錄的擴大之時，一個動態記錄被連結了。每個新連結至少是20字節，所以下一個擴大可能在同樣的連結裡進行。如果不是，則另一個連結將被建立。您可以使用myisamchk -ed來找出連結的數目。所有的連結可以用myisamchk -r來移除。

15.1.3.3. 已壓縮資料表特徵

已壓縮儲存格式是由myisampack工具建立的只讀格式。

所有MySQL分發版裡都預設包括myisampack。已壓縮資料表可以用myisamchk來解壓縮。

已壓縮資料表有下列特徵：

· 已壓縮資料表佔據非常小的磁盤空間。這最小化了磁盤用量，當使用緩慢的磁盤（如CD-ROM)之時，這是很有用的。

· 每個記錄是被單獨壓縮的，所以只有非常小的訪問開支。依據資料表中最大的記錄，一個記錄的頭在每個資料表中佔據1到3個字節。每個列被不同地壓縮。通常每個列有一個不同的Huffman樹。一些壓縮類型如下：

o 後綴空間壓縮。

- 前綴空間壓縮。

- 零值的數用一個位來儲存。

- 如果在一個整型列中的值有一個小的範圍，列被用最小可能的類型來儲存。比如，一個BIGINT列（8字節），如果所有它的值在-128到127範圍內，它可以被儲存為TINYINT列（1字節）

- 如果一個列僅有一小組可能的值，列的類型被轉化成ENUM。

- 一個列可以使用先前壓縮類型的任意合併。

· 可以處理固定長度或動態長度記錄。

15.1.4. MyISAM資料表方面的問題

15.1.4.1. 損壞的MyISAM資料表

15.1.4.2. 未被適當關閉的資料表的問題

MySQL用來儲存數據的檔案格式已經被廣泛測試過，但總是有導致數據資料表變得損壞的環境。

15.1.4.1. 損壞的MyISAM資料表

即使MyISAM資料表格式非常可靠（SQL語句對資料表做的所有改變在語句返回之前被寫下），如果下列任何事件發生，您依然可以獲得損壞的資料表：

· mysqld程序在寫中間被殺掉。

· 發生未預期的計算機關閉（例如，計算機被關閉）。

· 硬件故障。

· 您可以同時在正被伺服器修改的資料表上使用外部程式（如myisamchk）。

· MySQL或MyISAM代碼的軟件問題。

一個損壞的資料表的典型症狀如下：

· 當在從資料表中選擇數據之時，您得到如下錯誤：

·                Incorrect key file for table: '...'. Try to repair it

· 查詢不能在資料表中找到行或返回不完全的數據。

您可以用CHECK TABLE statement語句來檢查MyISAM資料表的健康，並用REPAIR TABLE修復一個損壞的MyISAM資料表。當mysqld不運行之時，您也可以用myisamchk命令檢查或修理一個資料表。請參閱13.5.2.3節，「CHECK TABLE語法”， 13.5.2.6節，「REPAIR TABLE語法”，和5.9.5節，「myisamchk — MyISAM資料表維護工具”。

如果您的資料表變得頻繁損壞，您應該試著確定為什麼會這樣的原因。要明白的最重要的事是資料表變得損壞是不是因為伺服器崩潰的結果。您可以在錯誤日誌中搜尋最近的restarted mysqld消息來早期驗證這個。如果存在這樣一個消息，則資料表損壞是伺服器死掉的一個結果是很有可能的。否則，損壞可能在正常操作中發生。這是一個問題。您應該試著建立一個展示這個問題的可重複生成的測試案例。請參閱A.4.2節，「如果MySQL保持崩潰，該怎麼做” 及E.1.6節，「如果出現資料表崩潰，請生成測試案例”。

15.1.4.2. 未被適當關閉的資料表的問題

每個MyISAM索引檔案(.MYI)在頭有一個計數器，它可以被用來檢查一個資料表是否被恰當地關閉。如果您從CHECK TABLE或myisamchk得到下列警告，意味著這個計數器已經不同步了：

clients are using or haven't closed the table properly

這個警告並不是完全意味著資料表已被破壞，但您至少應該檢查資料表。

計數器的工作方式如下：

· 資料表在MySQL中第一次被更新，索引檔案頭的計數器加一。

· 在未來的更新中，計數器不被改變。

· 當資料表的最後實例被關閉（因為一個操作FLUSH TABLE或因為在資料表緩衝區中沒有空間）之時，若資料表已經在任何點被更新，則計數器減一。

· 當您修理或檢查資料表並且發現資料表完好之時，計數器被重置為零。

· 要避免與其它可能檢查資料表的程序進行事務的問題，若計數器為零，在關閉時計數器不減一。

換句話來說，計數器只有在下列情況會不同步：

· MyISAM資料表不隨第一次發出的LOCK TABLES和FLUSH TABLES被複製。

· MySQL在一次更新和最後關閉之間崩潰（注意，資料表可能依然完好，因為MySQL總是在每個語句之間為每件事發出寫操作）。

· 一個資料表被myisamchk --recover或myisamchk --update-state修改，同時被mysqld使用。

· 多個mysqld伺服器正使用資料表，並且一個伺服器在一個資料表上執行REPAIR TABLE或CHECK TABLE，同時該資料表也被另一個伺服器使用。在這個結構中，使用CHECK TABLE是安全的，雖然您可能從其它伺服器上得到警告。儘管如此，REPAIR TABLE應該被避免，因為當一個伺服器用一個新的數據檔案替代舊的之時，這並沒有發送信號到其它伺服器上。

總的來說，在多伺服器之間分享一個數據目錄是一個壞主意。請參閱5.12節，「在同一個機器上運行多個MySQL伺服器” 獲得更多地討論

15.2. InnoDB儲存引擎

15.2.5. 建立InnoDB資料表空間

15.2.6. 建立InnoDB資料表

15.2.7. 新增和刪除InnoDB數據和日誌檔案

15.2.8. InnoDB資料庫的備份和恢復atabase

15.2.9. 把InnoDB資料庫移到另一台機器上

15.2.10. InnoDB事務模型和鎖定

15.2.11. InnoDB性能調節提示

15.2.16. 對InnoDB資料表的限制

15.2.17. InnoDB故障診斷和排除

15.2.1. InnoDB概述

InnoDB給MySQL提供了具有提交，回滾和崩潰恢復能力的事務安全（ACID兼容）儲存引擎。InnoDB鎖定在行級並且也在SELECT語句提供一個Oracle風格一致的非鎖定讀。這些特色增加了多用戶部署和性能。沒有在InnoDB中擴大鎖定的需要，因為在InnoDB中行級鎖定適合非常小的空間。InnoDB也支援FOREIGN KEY強制。在SQL查詢中，您可以自由地將InnoDB類型的資料表與其它MySQL的資料表的類型混合起來，甚至在同一個查詢中也可以混合。

InnoDB是為處理巨大數據量時的最大性能設計。它的CPU效率可能是任何其它基於磁盤的關係資料庫引擎所不能匹敵的。

InnoDB儲存引擎被完全與MySQL伺服器整合，InnoDB儲存引擎為在主內存中緩存數據和索引而維持它自己的緩衝池。InnoDB儲存它的資料表＆索引在一個資料表空間中，資料表空間可以包含數個檔案（或原始磁盤分區）。這與MyISAM資料表不同，比如在MyISAM資料表中每個資料表被存在分離的檔案中。InnoDB 資料表可以是任何尺寸，即使在檔案尺寸被限制為2GB的作業系統上。

InnoDB預設地被包含在MySQL二進制分發中。Windows Essentials installer使InnoDB成為Windows上MySQL的預設資料表。

InnoDB被用來在眾多需要高性能的大型資料庫站點上產生。著名的Internet新聞站點Slashdot.org運行在InnoDB上。Mytrix, Inc.在InnoDB上儲存超過1TB的數據，還有一些其它站點在InnoDB上處理平均每秒800次插入/更新的負荷。

InnoDB在和MySQL一樣在同一個GNU GPL證書，第2版（1991年6月版）下發行。更多有關MySQL證書的訊息，請參閱http://www.mysql.com/company/legal/licensing/。

關於InnoDB儲存引擎，在http://forums.mysql.com/list.php?22有一個詳細的論壇。

15.2.2. InnoDB聯繫訊息

InnoDB引擎的廠家的聯繫訊息，Innobase Oy的聯繫方式如下：

Web site: http://www.innodb.com/

Email: <sales@innodb.com>

Phone: +358-9-6969 3250 (office)

       +358-40-5617367 (mobile)

Innobase Oy Inc.

World Trade Center Helsinki

Aleksanterinkatu 17

P.O.Box 800

00101 Helsinki

Finland

15.2.3. InnoDB配置

InnoDB儲存引擎是預設地被允許的。如果您不想用InnoDB資料表，您可以新增skip-innodb選項到MySQL選項檔案。

被InnoDB儲存引擎管理的兩個重要的基於磁盤的資源是InnoDB資料表空間數據檔案和它的日誌檔案。

如果您指定無InnoDB配置選項，MySQL將在MySQL數據目錄下建立一個名為ibdata1的10MB大小的自動延伸數據檔案，以及兩個名為ib_logfile0和ib_logfile1的5MB大小的日誌檔案。

註釋：InnoDB給MySQL提供具有提交，回滾和崩潰恢復能力的事務安全（ACID兼容）儲存引擎。如果擬運行的作業系統和硬件不能如廣告說的那樣運行，InnoDB就不能實現如上能力。許多作業系統或磁盤子系統可能為改善性能而延遲或記錄寫操作。在一些作業系統上，就是系統使用（fsync()）也要等著，直到所有未寫入已被刷新檔案的數據在被刷新到穩定內存之前可以確實返回了。因為這個，作業系統崩潰或掉電可能損壞當前提交的數據，或者在最壞的情況，因為寫操作已被記錄了，甚至破壞了資料庫。如果數據完整性對您很重要，您應該在用任何程式於生產中之前做一些“pull-the-plug”測試。Mac OS X 10.3 及以後版本，InnoDB使用一個特別的fcntl()檔案刷新方法。在Linux下，建議禁止回寫緩存。

在ATAPI硬盤上，一個類似hdparm -W0 /dev/hda命令可能起作用。小心某些驅動器或者磁盤控制器可能不能禁止回寫緩存。

註釋：要獲得好的性能，您應該如下面例子所討論那樣，明確提供InnoDB參數。自然地，您應該編輯設置來適合您的硬件和要求。

要建立InnoDB資料表空間檔案，在my.cnf選項檔案裡的[mysqld]節裡使用innodb_data_file_path選項。在Windows上，您可以替代地使用my.ini檔案。innodb_data_file_path的值應該為一個或多個數據檔案規格的列資料表。如果您命名一個以上的數據檔案，用分號(‘;’)分隔它們：

innodb_data_file_path=datafile_spec1[;datafile_spec2]...

例如：把明確建立的具有相同特徵的資料表空間作為預設設置的設置操作如下：

[mysqld]

innodb_data_file_path=ibdata1:10M:autoextend

這個設置配置一個可延伸大小的尺寸為10MB的單獨檔案，名為ibdata1。沒有給出檔案的位置，所以預設的是在MySQL的數據目錄內。

尺寸大小用M或者G後綴來指定說明單位是MB或者GB。

一個資料表空間，它在數據目錄裡包含一個名為ibdata1的固定尺寸50MB的數據檔案和一個名為ibdata2大小為50MB的自動延伸檔案，其可以像這樣被配置：

[mysqld]

innodb_data_file_path=ibdata1:50M;ibdata2:50M:autoextend

一個指定數據檔案的完全後綴包括檔案名，它的尺寸和數個可選屬性：

file_name:file_size[:autoextend[:max:max_file_size]]

autoextend屬性和後面跟著的屬性只可被用來對innodb_data_file_path行裡最後一個數據檔案。

如果您對最後的數據檔案指定autoextend選項。如果數據檔案耗盡了資料表空間中的自由空間，InnoDB就延伸數據檔案。延伸的幅度是每次8MB。

如果磁盤已滿，您可能想要把其它數據新增到另一個硬盤上。重新配置一個已存在資料表空間的指令見15.2.7節，「新增和刪除InnoDB數據和日誌檔案”。

InnoDB並不感知最大檔案尺寸，所以要小心檔案系統，在那上面最大的檔案尺寸是2GB。要為一個自動延伸數據檔案指定最大尺寸，請使用max屬性。下列配置允許ibdata1漲到極限的500MB：

[mysqld]

innodb_data_file_path=ibdata1:10M:autoextend:max:500M

InnoDB預設地在MySQL數據目錄建立資料表空間檔案。要明確指定一個位置，請使用innodb_data_home_dir選項。比如，要使用兩個名為ibdata1和ibdata2的檔案，但是要把他們建立到/ibdata，像如下一樣配置InnoDB：

[mysqld]

innodb_data_home_dir = /ibdata

innodb_data_file_path=ibdata1:50M;ibdata2:50M:autoextend

註釋：InnoDB不建立目錄，所以在啟動伺服器之前請確認/ibdata目錄的確存在。這對您配置的任何日誌檔案目錄來說也是真實的。使用Unix或DOS的mkdir命令來建立任何必需的目錄。

通過把innodb_data_home_dir的值原原本本地部署到數據檔案名，並在需要的地方新增斜槓或反斜槓，InnoDB為每個數據檔案形成目錄路徑。如果innodb_data_home_dir選項根本沒有在my.cnf中提到，預設值是“dot”目錄 ./，這意思是MySQL數據目錄。

如果您指定innodb_data_home_dir為一個空字串，您可以為列在innodb_data_file_path值裡的數據檔案指定絕對路徑。下面的例子等價於前面那個例子：

[mysqld]

innodb_data_home_dir =

innodb_data_file_path=/ibdata/ibdata1:50M;/ibdata/ibdata2:50M:autoextend

一個簡單的my.cnf例子。假設您有一台配備128MB內存和一個硬盤的計算機。下面的例子顯示在my.cnf或my.ini裡對InnoDB可能的配置參數，包括autoextend屬性。

這個例子適合大多數在Unix和Windows上，不想分配InnoDB數據檔案和日誌檔案到數個磁盤上的用戶。它在MySQL數據目錄建立一個自動延伸數據檔案ibdata1和兩個日誌檔案ib_logfile0及ib_logfile1。同樣，InnoD在數據目錄裡自動建立的小型檔案InnoDB日誌檔案ib_arch_log_0000000000也結束。

[mysqld]

# You can write your other MySQL server options here

# ...

# Data files must be able to hold your data and indexes.

# Make sure that you have enough free disk space.

innodb_data_file_path = ibdata1:10M:autoextend

# Set buffer pool size to 50-80% of your computer's memory

set-variable = innodb_buffer_pool_size=70M

set-variable = innodb_additional_mem_pool_size=10M

# Set the log file size to about 25% of the buffer pool size

set-variable = innodb_log_file_size=20M

set-variable = innodb_log_buffer_size=8M

innodb_flush_log_at_trx_commit=1

請確認MySQL伺服器有適當的權限在數據目錄裡建立檔案。更一般地，伺服器必須對任何它需要建立數據檔案或日誌檔案的目錄有訪問權限。

注意，在一些檔案系統上，數據檔案必需小於2GB。數據檔案的合併尺寸必須至少10MB。

當您第一次建立一個InnoDB資料表空間，最好從命令行來啟動MySQL伺服器。InnoDB然後把資料庫建立的訊息打印到屏幕，所以您可以看見正在發生什麼。比如，在Windows上，如果mysqld-max位於C:\mysql\bin，您可以如下來啟動它：

C:\> C:\mysql\bin\mysqld-max --console

如果您不發送伺服器輸出到屏幕上，請檢查伺服器的錯誤日誌來看在啟動過程中InnoDB打印了什麼。

請參閱15.2.5節，「建立InnoDB資料表空間”，以獲得InnoDB顯示的訊息看起來應該像什麼的例子。

Windows上如何指定選項? 在Windows上選項檔案的規則如下：

· 只應該建立一個my.cnf或檔案。

· my.cnf檔案應該被放在C盤根目錄。

· my.ini檔案應該被放置在WINDIR目錄；例如C:\WINDOWS或C:\WINNT。您可以在Windows控制台的命令提示符使用SET命令來打印WINDIR的值：

·                C:\> SET WINDIR

·                windir=C:\WINNT

· 如果您的PC在C盤不是啟動盤的地方使用啟動裝載機，您唯一的選擇是使用my.ini檔案。

· 如果您使用安裝和配置嚮導安裝的MySQL，my.ini檔案被放在MySQL的安裝目錄。請參閱2.3.5.14節，「my.ini檔案的位置”。

Unix上在哪裡指定選項？ 在Unix上，mysqld從下列檔案，如果它們存在的話。以下列的順序讀取選項：

· /etc/my.cnf

全局選項。

· $MYSQL_HOME/my.cnf

伺服器專用選項。

· defaults-extra-file

--defaults-extra-file選項指定的檔案。

· ~/.my.cnf

用戶專用選項。

MYSQL_HOME代資料表環境變數，它內含著到包含伺服器專用my.cnf檔案的目錄的路徑。

如果您確信mysqld只從指定檔案讀取選項，您可以在啟動伺服器之時在命令行使用--defaults-option作為第一個選項：

mysqld --defaults-file=your_path_to_my_cnf

一個高級的my.cnf例子。假設您有一台Linux計算機，有2GB內存和三個60GB硬盤（在目錄路徑/, /dr2和/dr3)。下列例子顯示了在my.cnf裡對InnoDB可能的配置參數。

[mysqld]

# You can write your other MySQL server options here

# ...

innodb_data_home_dir =

# Data files must be able to hold your data and indexes

innodb_data_file_path = /ibdata/ibdata1:2000M;/dr2/ibdata/ibdata2:2000M:autoextend

# Set buffer pool size to 50-80% of your computer's memory,

# but make sure on Linux x86 total memory usage is < 2GB

innodb_buffer_pool_size=1G

innodb_additional_mem_pool_size=20M

innodb_log_group_home_dir = /dr3/iblogs

innodb_log_files_in_group = 2

# Set the log file size to about 25% of the buffer pool size

innodb_log_file_size=250M

innodb_log_buffer_size=8M

innodb_flush_log_at_trx_commit=1

innodb_lock_wait_timeout=50

# Uncomment the next lines if you want to use them

#innodb_thread_concurrency=5

注意，該例子把兩個數據檔案放在不同磁盤上。InnoDB開始用第一個數據檔案填充資料表空間。在一些情況下，如果所有數據不被放置在同一物理磁盤上，這樣將改善資料庫的性能。把日誌檔案放在與數據檔案不同的磁盤上對性能是經常很有好處的。您也可以使用原始磁盤分區（原始設備）作為InnoDB數據檔案，這樣可以加速I/O。請參閱15.2.14.2節，「為資料表空間使用原始設備”。

警告：在32位GNU/Linux x86上,您必須要小心不要設置過高的內存用量。glibc可能允許程序堆積線上程堆棧上發展，它會造成您的伺服器崩潰。如果下列資料表達式的值接近或者超過2GB，系統會面臨危機：

innodb_buffer_pool_size

+ key_buffer_size

+ max_connections*(sort_buffer_size+read_buffer_size+binlog_cache_size)

+ max_connections*2MB

每個線程使用一個堆棧（通常是2MB，但在MySQL AB二進制分發版裡只有256KB）並且在最壞的情況下也使用sort_buffer_size + read_buffer_size附加內存。

您可以自己編譯MySQL，在32位Windows上使用高達64GB物理內存。請參閱15.2.4節，「InnoDB啟動選項”裡對innodb_buffer_pool_awe_mem_mb的描述。

如何調整其它mysqld伺服器參數？下列值是典型的，且適用於多數用戶：

[mysqld]

skip-external-locking

max_connections=200

read_buffer_size=1M

sort_buffer_size=1M

# Set key_buffer to 5 - 50% of your RAM depending on how much

# you use MyISAM tables, but keep key_buffer_size + InnoDB

# buffer pool size < 80% of your RAM

key_buffer_size=value

15.2.4. InnoDB啟動選項

這一節敘述InnoDB相關的伺服器選項，所有這些選項可以以--opt_name=value的形式在命令行或在選項檔案裡被指定。

· innodb_additional_mem_pool_size

InnoDB用來儲存數據目錄訊息＆其它內部數據結構的內存池的大小。您應用程式裡的資料表越多，您需要在這裡分配越多的內存。如果InnoDB用光了這個池內的內存，InnoDB開始從作業系統分配內存，並且往MySQL錯誤日誌寫警告訊息。預設值是1MB。

· innodb_autoextend_increment

當自動延伸資料表空間被填滿之時，為延伸而增加的尺寸（MB為單位）。預設值是8。這個選項可以在運行時作為全局系統變數而改變。

· innodb_buffer_pool_awe_mem_mb

如果緩衝池被放在32位Windows的AWE內存裡，這個參數就是緩衝池的大小（MB為單位）。(僅在32位Windows上相關）如果您的32位Windows作業系統使用所謂的“地址窗口延伸（AWE)”支援超過4GB內存，您可以用這個參數把InnoDB緩衝池分配進AWE物理內存。這個參數最大的可能值是64000。如果這個參數被指定了，innodb_buffer_pool_size是在32位地址空間的mysqld內的窗口，InnoDB把那個AWE內存映射上去。對innodb_buffer_pool_size參數，一個比較好的值是500MB。

· innodb_buffer_pool_size

InnoDB用來緩存它的數據和索引的內存緩衝區的大小。您把這個值設得越高，訪問資料表中數據需要得磁盤I/O越少。在一個專用的資料庫伺服器上，您可以設置這個參數達機器物理內存大小的80%。儘管如此，還是不要把它設置得太大，因為對物理內存的競爭可能在作業系統上導致內存調度。

· innodb_checksums

InnoDB在所有對磁盤的頁面讀取上使用校驗和驗證以確保額外容錯防止硬件損壞或數據檔案。儘管如此，在一些少見的情況下（比如運行標準檢查之時）這個額外的安全特徵是不必要的。在這些情況下，這個選項（預設是允許的）可以用--skip-innodb-checksums來關閉。

· innodb_data_file_path

到單獨數據檔案和它們尺寸的路徑。通過把innodb_data_home_dir連接到這裡指定的每個路徑，到每個數據檔案的完整目錄路徑可被獲得。檔案大小通過給尺寸值尾加M或G以MB或者GB（1024MB）為單位被指定。檔案尺寸的和至少是10MB。在一些作業系統上，檔案必須小於2GB。如果您沒有指定innodb_data_file_path，開始的預設行為是建立一個單獨的大小10MB名為ibdata1的自延伸數據檔案。在那些支援大檔案的作業系統上，您可以設置檔案大小超過4GB。您也可以使用原始磁盤分區作為數據檔案，請參閱15.2.14.2節，「為資料表空間使用原始設備”。

· innodb_data_home_dir

目錄路徑對所有InnoDB數據檔案的共同部分。如果您不設置這個值，預設是MySQL數據目錄。您也可以指定這個值為一個空字串，在這種情況下，您可以在innodb_data_file_path中使用絕對檔案路徑。

· innodb_doublewrite

預設地，InnoDB儲存所有數據兩次，第一次儲存到doublewrite緩衝，然後儲存到確實的數據檔案。這個選項可以被用來禁止這個功能。類似於innodb_checksums，這個選項預設是允許的；因為標準檢查或在對頂級性能的需要超過對數據完整性或可能故障的關注之時，這個選項用--skip-innodb-doublewrite來關閉。

· innodb_fast_shutdown

如果您把這個參數設置為0，InnoDB在關閉之前做一個完全淨化和一個插入緩衝合併。這些操作要花幾分鐘時間，設置在極端情況下要幾個小時。如果您設置這個參數為1，InnoDB在關閉之時跳過這些操作。預設值為1。如果您設置這個值為2 (在Netware無此值)， InnoDB將刷新它的日誌然後冷關機，彷彿MySQL崩潰一樣。已提交的事務不會被丟失，但在下一次啟動之時會做一個崩潰恢復。

· innodb_file_io_threads

InnoDB中檔案I/O線程的數量。正常地，這個參數是用預設的，預設值是4，但是大數值對Windows磁盤I/O有益。在Unix上，增加這個數沒有效果，InnoDB總是使用預設值。

· innodb_file_per_table

這個選項致使InnoDB用自己的.ibd檔案為儲存數據和索引建立每一個新資料表，而不是在共享資料表空間中建立。請參閱15.2.6.6節，「使用Per-Table資料表空間”。

· innodb_flush_log_at_trx_commit

當innodb_flush_log_at_trx_commit被設置為0，日誌緩衝每秒一次地被寫到日誌檔案，並且對日誌檔案做到磁盤操作的刷新，但是在一個事務提交不做任何操作。當這個值為1（預設值）之時，在每個事務提交時，日誌緩衝被寫到日誌檔案，對日誌檔案做到磁盤操作的刷新。當設置為2之時，在每個提交，日誌緩衝被寫到檔案，但不對日誌檔案做到磁盤操作的刷新。儘管如此，在對日誌檔案的刷新在值為2的情況也每秒發生一次。我們必須注意到，因為程序安排問題，每秒一次的刷新不是100%保證每秒都發生。您可以通過設置這個值不為1來獲得較好的性能，但隨之您會在一次崩潰中損失二分之一價值的事務。如果您設置這個值為0，那麼任何mysqld程序的崩潰會刪除崩潰前最後一秒的事務，如果您設置這個值為2，那麼只有作業系統崩潰或掉電才會刪除最後一秒的事務。儘管如此，InnoDB的崩潰恢復不受影響，而且因為這樣崩潰恢復開始作用而不考慮這個值。注意，許多作業系統和一些磁盤硬件會欺騙刷新到磁盤操作。儘管刷新沒有進行，您可以告訴mysqld刷新已經進行。即使設置這個值為1，事務的持久程度不被保證，且在最壞情況下掉電甚至會破壞InnoDB資料庫。在SCSI磁盤控制器中，或在磁盤自身中，使用有後備電池的磁盤緩存會加速檔案刷新並且使得操作更安全。您也可以試著使用Unix命令hdparm來在硬件緩存中禁止磁盤寫緩存，或使用其它一些對硬件提供商專用的命令。這個選項的預設值是1。

· innodb_flush_method

這個選項只在Unix系統上有效。如果這個選項被設置為fdatasync （預設值），InnoDB使用fsync()來刷新數據和日誌檔案。如果被設置為O_DSYNC，InnoDB使用O_SYNC來打開並刷新日誌檔案，但使用fsync()來刷新數據檔案。如果O_DIRECT被指定了（在一些GNU/Linux版本商可用），InnoDB使用O_DIRECT來打開數據檔案，並使用fsync()來刷新數據和日誌檔案。注意，InnoDB使用fsync()來替代fdatasync()，並且它預設不使用O_DSYNC，因為這個值在許多Unix變種上已經發生問題。

· innodb_force_recovery

警告：這個選項僅在一個緊急情況下被定義，當時您想要從損壞的資料庫轉儲資料表。可能的值為從1到6。這些值的意思在15.2.8.1節，「強制恢復”中敘述。作為一個安全措施，當這個選項值大於零之時，InnoDB阻止用戶修改數據。

· innodb_lock_wait_timeout

InnoDB事務在被回滾之前可以等待一個鎖定的超時秒數。InnoDB在它自己的鎖定資料表中自動檢測事務死鎖並且回滾事務。InnoDB用LOCK TABLES語句注意到鎖定設置。預設值是50秒。

為在一個複製建立中最大可能的持久程度和連貫性，您應該在主伺服器上的my.cnf檔案裡使用innodb_flush_log_at_trx_commit=1和sync-binlog=1。

· innodb_locks_unsafe_for_binlog

這個選項在InnoDB搜索和索引掃瞄中關閉下一鍵鎖定。這個選項的預設值是假（false）。

正常地，InnoDB使用一個被稱為next-key locking的算法。當搜索或掃瞄一個資料表索引之時，InnoDB以這樣一種方式實行行級鎖定，它對任何遇到的索引記錄設置共享的或獨佔的鎖定。因此，行級鎖定實際是索引記錄鎖定。InnoDB對索引記錄設置的鎖定也影響被鎖定索引記錄之前的“gap”。如果一個用戶對某一索引內的記錄R又共享的或獨佔的鎖定，另一個用戶不能立即在R之前以索引的順序插入一個新的索引記錄。這個選項導致InnoDB不在搜索或索引掃瞄中使用下一鍵鎖定。下一鍵鎖定仍然被用來確保外部鍵強制及重複鍵核查。注意，使用這個選項可能會導致一些詭異的問題：假設您想要用值大於100的標識符從子資料表裡讀取並鎖定所有的子記錄，同時向隨後在選定的行更新一些列：

SELECT * FROM child WHERE id > 100 FOR UPDATE;

假設在id列有一個索引。查詢從id大於100的第一個記錄開始掃瞄索引。如果在索引記錄上的鎖定不把在間隙處生成的插入排除鎖定，同時一個新行被插進資料表中。如果您在同一個事務之內執行同樣的SELECT，您會在查詢返回的結果包裡看到一個新行。這也意味著，如果新條目被加進資料庫，InnoDB不保證連續性；儘管如此，對應連續性仍被保證。因此，如果這個選項被使用，InnoDB在大多數孤立級別保證READ COMMITTED。

這個選項甚至更不安全。InnoDB在一個UPDATE或DELETE中只鎖定它更新或刪除的行。這大大減少了死鎖的可能性，但是可以發生死鎖。注意，即使在當類似的操作影響不同行時的情況下，這個選項仍然不允許諸如UPDATE這樣的操作壓倒相似選項（比如另一個UPDATE）。考慮下列例子：

CREATE TABLE A(A INT NOT NULL, B INT);

INSERT INTO A VALUES (1,2),(2,3),(3,2),(4,3),(5,2);

COMMIT;

如果一個連接執行一個查詢：

SET AUTOCOMMIT = 0;

UPDATE A SET B = 5 WHERE B = 3;

並且其它連接跟著第一個連接執行其它查詢：

SET AUTOCOMMIT = 0;

UPDATE A SET B = 4 WHERE B = 2;

接著查詢2要等查詢1的提交或回滾，因為查詢1對行（2，3）有一個獨佔的鎖定，並且查詢2在掃瞄行的同時也試著對它不能鎖定的同一個行（2，3）採取一個獨佔的鎖定。這是因為當innodb_locks_unsafe_for_binlog選項被使用之時，查詢2首先對一個行採取一個獨佔的鎖定，然後確定是否這個行屬於結果包，並且如果不屬於，就釋放不必要的鎖定。

因此，查詢1按如下執行：

x-lock(1,2)

unlock(1,2)

x-lock(2,3)

update(2,3) to (2,5)

x-lock(3,2)

unlock(3,2)

x-lock(4,3)

update(4,3) to (4,5)

x-lock(5,2)

unlock(5,2)

並且查詢2按如下執行：

x-lock(1,2)

update(1,2) to (1,4)

x-lock(2,3) - 等待查詢1提交或回滾

· innodb_log_arch_dir

如果我們使用日誌檔案，被完整寫入的日誌檔案所在的目錄也被歸檔。這個參數值如果被使用了，應該被設置得與innodb_log_group_home_dir一樣。儘管如此，它不是必需的。

· innodb_log_archive

這個值當前被設為0。因為MySQL使用它自己的日誌檔案從備份來恢復，所以當前沒有必要來歸檔InnoDB日誌檔案。這個選項的預設值是0。

· innodb_log_buffer_size

InnoDB用來往磁盤上的日誌檔案寫操作的緩衝區的大小。明智的值是從1MB到8MB。預設的是1MB。一個大的日誌緩衝允許大型事務運行而不需要在事務提交之前往磁盤寫日誌。因此，如果您有大型事務，使日誌緩衝區更大以節約磁盤I/O。

· innodb_log_file_size

在日誌組裡每個日誌檔案的大小。在32位計算機上日誌檔案的合併大小必須少於4GB。預設是5MB。明智的值從1MB到N分之一緩衝池大小，其中N是組裡日誌檔案的數目。值越大，在緩衝池越少需要檢查點刷新行為，以節約磁盤I/O。但更大的日誌檔案也意味這在崩潰時恢復得更慢。

· innodb_log_files_in_group

在日誌組裡日誌檔案的數目。InnoDB以循環方式寫進檔案。預設是2（推薦）。

· innodb_log_group_home_dir

到InnoDB日誌檔案的目錄路徑。它必須有和innodb_log_arch_dir一樣的值。如果您不指定任何InnoDB日誌參數，預設的是在MySQL數據目錄裡建立兩個5MB大小名為ib_logfile0和ib_logfile1的檔案。

· innodb_max_dirty_pages_pct

這是一個範圍從0到100的整數。預設是90。InnoDB中的主線程試著從緩衝池寫頁面，使得髒頁（沒有被寫的頁面）的百分比不超過這個值。如果您有SUPER權限，這個百分比可以在伺服器運行時按下面來改變：

SET GLOBAL innodb_max_dirty_pages_pct = value;

· innodb_max_purge_lag

這個選項控制在淨化操作被滯後之時，如何延遲INSERT, UPDATE和DELETE操作。（請參閱15.2.12節，「多版本的實施”）。這個參數的預設值是零，意為無延遲。這個選項可以在運行時作為全局系統變數而被改變。

InnoDB事務系統維持一個事務列資料表，該列資料表有被UPDATE或DELETE操作標誌為刪除的索引記錄。讓這個列資料表的長度為purge_lag。當purge_lag超過innodb_max_purge_lag之時，每個INSERT, UPDATE和DELETE操作延遲 ((purge_lag/innodb_max_purge_lag)*10)-5毫秒。在淨化批處理的開始，延遲每隔10秒計算。如果因為一個舊的可以看到行被淨化的一致的讀查看，刪除操作不被延遲。

對有問題的工作量，典型設置可能是1百萬，假設我們的事務很小，只有100字節大小，我們就可以允許在我們的資料表之中有100MB未淨化的行。

· innodb_mirrored_log_groups

我們為資料庫保持的日誌組內同樣拷貝的數量。當前這個值應該被設為1。

· innodb_open_files

在InnoDB中，這個選項僅與您使用多資料表空間時有關。它指定InnoDB一次可以保持打開的.ibd檔案的最大數目。最小值是10。預設值300。

對.ibd檔案的檔案描述符是僅對InnoDB的。它們獨立於那些由--open-files-limit伺服器選項指定的描述符，且不影響資料表緩存的操作。

· innodb_status_file

這個選項讓InnoDB為週期的SHOW INNODB STATUS輸出建立一個檔案<datadir>/innodb_status.<pid>。

· innodb_support_xa

當被設置為ON或者1（預設地），這個變數允許InnoDB支援在XA事務中的雙向提交。允許innodb_support_xa導致一個額外的對事務準備的磁盤刷新。如果您對使用XA並不關心，您可以通過設置這個選項為OFF或0來禁止這個變數，以減少磁盤刷新的次數並獲得更好的InnoDB性能。

· innodb_table_locks

InnoDB重視LOCK TABLES，直到所有其它線程已經釋放他們所有對資料表的鎖定，MySQL才從LOCK TABLE .. WRITE返回。預設值是1，這意為LOCK TABLES讓InnoDB內部鎖定一個資料表。在使用AUTOCOMMIT=1的應用裡，InnoDB的內部資料表鎖定會導致死鎖。您可以在my.cnf檔案（Windows上是my.ini檔案）裡設置innodb_table_locks=0 來消除這個問題。

· innodb_thread_concurrency

InnoDB試著在InnoDB內保持作業系統線程的數量少於或等於這個參數給出的限制。如果有性能問題，並且SHOW INNODB STATUS顯示許多線程在等待信號，可以讓線程“thrashing” ，並且設置這個參數更小或更大。如果您的計算機有多個處理器和磁盤，您可以試著這個值更大以更好地利用計算機的資源。一個推薦的值是系統上處理器和磁盤的個數之和。值為500或比500大會禁止使用並發檢查。預設值是20，並且如果設置大於或等於20，並發檢查將被禁止。

· innodb_status_file

這個選項讓InnoDB為週期的SHOW INNODB STATUS輸出建立一個檔案<datadir>/innodb_status.<pid>。

15.2.5. 建立InnoDB資料表空間

15.2.5.1. 處理InnoDB初始化問題

假設您已經安裝了MySQL，並且已經編輯了選項檔案，使得它包含必要的InnoDB配置參數。在啟動MySQL之前，您應該驗證您為InnoDB數據檔案和日誌檔案指定的目錄是否存在，並且MySQL有訪問這些目錄的權限。InnoDB不能建立目錄，只能建立檔案。也檢查您有足夠的空間來放數據和日誌檔案。

當建立InnoDB資料庫時，最好從命令提示符運行MySQL伺服器mysqld，而不要從mysqld_safe包裝或作為Windows的服務來運行。當您從命令提示符運行，您可看見mysqld打印什麼以及發生了什麼。在Unix上，只需要使用mysqld。在Windows上，使用--console選項。

當在選項檔案裡初始地配置InnoDB後，開始啟動MySQL伺服器之時，InnoDB建立一個數據檔案和日誌檔案。InnoDB打印如下一些東西：

InnoDB: The first specified datafile /home/heikki/data/ibdata1

did not exist:

InnoDB: a new database to be created!

InnoDB: Setting file /home/heikki/data/ibdata1 size to 134217728

InnoDB: Database physically writes the file full: wait...

InnoDB: datafile /home/heikki/data/ibdata2 did not exist:

new to be created

InnoDB: Setting file /home/heikki/data/ibdata2 size to 262144000

InnoDB: Database physically writes the file full: wait...

InnoDB: Log file /home/heikki/data/logs/ib_logfile0 did not exist:

new to be created

InnoDB: Setting log file /home/heikki/data/logs/ib_logfile0 size

to 5242880

InnoDB: Log file /home/heikki/data/logs/ib_logfile1 did not exist:

new to be created

InnoDB: Setting log file /home/heikki/data/logs/ib_logfile1 size

to 5242880

InnoDB: Doublewrite buffer not found: creating new

InnoDB: Doublewrite buffer created

InnoDB: Creating foreign key constraint system tables

InnoDB: Foreign key constraint system tables created

InnoDB: Started

mysqld: ready for connections

一個新的InnoDB資料庫被建立了。您可以用mysql這樣通常的MySQL客戶端程式連接到MySQL伺服器。當您用mysqladmin shutdown關閉MySQL伺服器之時，輸出類似如下：

010321 18:33:34  mysqld: Normal shutdown

010321 18:33:34  mysqld: Shutdown Complete

InnoDB: Starting shutdown...

InnoDB: Shutdown completed

您可以看數據檔案和日誌檔案，並且您可以看見檔案被建立。日誌目錄也包含一個名為ib_arch_log_0000000000的小檔案。這個檔案是資料庫被建立的結果，資料庫被建立之後InnoDB切斷日誌歸檔。當MySQL再次啟動之時，數據檔案＆日誌檔案已經被建立，所以輸出更簡潔：

InnoDB: Started

mysqld: ready for connections

您可以新增innodb_file_per_table選項到my.cnf檔案，並且讓InnoDB儲存每一個資料表到MySQL資料庫目錄裡自己的.ibd檔案。請參閱15.2.6.6節，「使用Per-Table資料表空間”。

15.2.5.1. 處理InnoDB初始化問題

如果InnoDB在一個檔案操作中打印一個作業系統錯誤，通常問題是如下中的一個：

· 您沒有建立一個InnoDB數據檔案目錄或InnoDB日誌目錄。

· mysqld沒有訪問這些目錄的權限以建立檔案。

· mysqld不能恰當地讀取my.cnf或my.ini選項檔案，因此不能看到您指定的選項。

· 磁盤已滿，或者超出磁盤配額。

· 您已經建立一個子目錄，它的名字與您指定的數據檔案相同。

· 在innodb_data_home_dir或innodb_data_file_path有一個語法錯誤。

當InnoDB試著初始化它的資料表空間或日誌檔案之時，如果出錯了，您應該刪除InnoDB建立的所有檔案。這意味著是所有ibdata檔案和所有ib_logfiles檔案。萬一您建立了一些InnoDB資料表，為這些資料表也從MySQL資料庫目錄刪除相應的.frm檔案(如果您使用多重資料表空間的話，也刪除任何.ibd檔案）。然後您可以試著再次建立InnoDB資料庫。最好是從命令提示符啟動MySQL伺服器，以便您可以查看發生了什麼。

15.2.6. 建立InnoDB資料表

15.2.6.1. 如何在InnoDB用不同API來使用事務

15.2.6.2. 轉換MyISAM資料表到InnoDB

15.2.6.3. AUTO_INCREMENT列如何在InnoDB中工作

15.2.6.4.外鍵約束

15.2.6.5. InnoDB和MySQL複製

15.2.6.6. 使用Per-Table資料表空間

假如您用mysql test命令啟動MySQL客戶端。要建立一個InnoDB資料表，您必須在資料表建立SQL語句中指定ENGINE = InnoDB或者TYPE = InnoDB選項：

CREATE TABLE customers (a INT, b CHAR (20), INDEX (a)) ENGINE=InnoDB;

CREATE TABLE customers (a INT, b CHAR (20), INDEX (a)) TYPE=InnoDB;

SQL語句在資料表空間的列上建立一個資料表和索引，資料表空間包含您在my.cnf指定的數據檔案。此外，MySQL在MySQL資料庫目錄下的test目錄裡建立一個名為customers.frm的檔案。內部地，InnoDB為'test/customers'資料表往自己的數據目錄新增一個條目。這意味這您可以在其它資料庫建立一個具有相同名字customers的資料表，資料表的名字不會與InnoDB內的衝突。

您可以對任何InnoDB資料表，通過使用SHOW TABLE STATUS語句，查詢在InnoDB資料表空間內空閒空間的數量。資料表空間內空閒空間的數量出現在SHOW TABLE STATUS的輸出結果內的Comment節裡。例如：

SHOW TABLE STATUS FROM test LIKE 'customers'

注意，統計的SHOW只給出關於InnoDB資料表的大概情況。它們被用於SQL最佳化。可是，資料表和索引保留的大小，以字節為單位是準確的。

15.2.6.1. 如何在InnoDB中用不同的API來使用事務

預設地，每個連接到MySQL伺服器的客戶端開始之時是允許自動提交模式的，這個模式自動提交您運行的每個SQL語句。要使用多語句事務，您可以用SQL語句SET AUTOCOMMIT = 0禁止自動提交，並且用COMMIT和ROLLBACK來提交或回滾您的事務。如果您想要autocommit保持打開狀態，可以在START TRANSACTION與COMMIT或ROLLBACK之間封裝您的事務。下列的例子演示兩個事務。第一個是被提交的，第二個是被回滾的：

shell> mysql test

Welcome to the MySQL monitor.  Commands end with ; or \g.

Your MySQL connection id is 5 to server version: 3.23.50-log

Type 'help;' or '\h' for help. Type '\c' to clear the buffer.

mysql> CREATE TABLE CUSTOMER (A INT, B CHAR (20), INDEX (A))

    -> ENGINE=InnoDB;

Query OK, 0 rows affected (0.00 sec)

mysql> BEGIN;

Query OK, 0 rows affected (0.00 sec)

mysql> INSERT INTO CUSTOMER VALUES (10, 'Heikki');

Query OK, 1 row affected (0.00 sec)

mysql> COMMIT;

Query OK, 0 rows affected (0.00 sec)

mysql> SET AUTOCOMMIT=0;

Query OK, 0 rows affected (0.00 sec)

mysql> INSERT INTO CUSTOMER VALUES (15, 'John');

Query OK, 1 row affected (0.00 sec)

mysql> ROLLBACK;

Query OK, 0 rows affected (0.00 sec)

mysql> SELECT * FROM CUSTOMER;

+------+--------+

| A    | B      |

+------+--------+

|   10 | Heikki |

+------+--------+

1 row in set (0.00 sec)

mysql>

在類似PHP, Perl DBI/DBD, JDBC, ODBC, 或者MySQL的標準C使用接口這樣的API上，您能夠以字串形式發送事務控制語句，如COMMIT，到MySQL伺服器，就像其它任何的SQL語句那樣，諸如SELECT或INSERT。一些API也提供單獨的專門的事務提交和回滾函數或者方法。

15.2.6.2. 轉換MyISAM資料表到InnoDB

要點：您不應該在mysql資料庫（比如，user或者host）裡把MySQL系統資料表轉換為InnoDB類型。系統資料表總是MyISAM型。

如果您想要所有（非系統）資料表都被建立成InnoDB資料表，您可以簡單地把default-table-type=innodb行新增到my.cnf或my.ini檔案的[mysqld]節裡。

InnoDB對MyISAM儲存引擎採用的單獨索引建立方法沒有做專門的最佳化。因此，它不值得導出或導入資料表以及隨後建立索引。改變一個資料表為InnoDB型最快的辦法就是直接插入進一個InnoDB資料表。即，使用ALTER TABLE ... ENGINE=INNODB，或用相同的定義建立一個空InnoDB資料表，並且用INSERT INTO ... SELECT * FROM ...插入行。

如果您對第二個鍵有UNIQUE約束，您可以在導入階段設置：SET UNIQUE_CHECKS=0，以臨時關掉唯一性檢查好加速資料表的導入。對於大資料表，這節省了大量的磁盤I/O，因為InnoDB隨後可以使用它的插入緩衝區來第二個索引記錄作為一批來寫入。

為獲得對插入程序的更好控制，分段插入大資料表可能比較好：

INSERT INTO newtable SELECT * FROM oldtable

   WHERE yourkey > something AND yourkey <= somethingelse;

所有記錄已經本插入之後，您可以重命名資料表。

在大資料表的轉換中，您應該增加InnoDB緩衝池的大小來減少磁盤I/O。儘管如此，不要使用超過80%的內部內存。您也可以增加InnoDB日誌檔案和日誌檔案的大小。

確信您沒有填滿資料表空間：InnoDB資料表比MyISAM資料表需要大得多的磁盤空間。如果一個ALTER TABLE耗盡了空間，它就開始一個回滾，並且如果它是磁盤綁定的，回滾可能要幾個小時。對於插入，InnoDB使用插入緩衝區來以成批地合併第二個索引記錄到索引中。那樣節省了大量磁盤I/O。在回滾中，沒有使用這樣的機制，而回滾要花比插入長30倍的時間來完成。

在失控的回滾情況下，如果您在資料庫中沒有有價值的數據，比較明智的是殺掉資料庫程序而不是等幾百萬個磁盤I/O被完成。完整的過程，請參閱15.2.8.1節，「強制恢復”。

15.2.6.3. AUTO_INCREMENT列在InnoDB裡如何工作

如果您為一個資料表指定AUTO_INCREMENT列，在數據詞典裡的InnoDB資料表句柄包含一個名為自動增長計數器的計數器，它被用在為該列賦新值。自動增長計數器僅被儲存在主內存中，而不是存在磁盤上。

InnoDB使用下列算法來為包含一個名為ai_col的AUTO_INCREMENT列的資料表T初始化自動增長計數器：伺服器啟動之後，當一個用戶對資料表T做插入之時，InnoDB執行等價如下語句的動作：

SELECT MAX(ai_col) FROM T FOR UPDATE;

語句取回的值逐次加一，並被賦給列和自動增長計數器。如果資料表是空的，值1被賦予該列。如果自動增長計數器沒有被初始化，而且用戶使用為資料表T顯示輸出的SHOW TABLE STATUS語句，則計數器被初始化（但不是增加計數）並被儲存以供隨後的插入使用。注意，在這個初始化中，我們對資料表做一個正常的獨佔讀鎖定，這個鎖持續到事務的結束。

InnoDB對為新建立資料表的初始化自動增長計數器允許同樣的過程。

注意，如果用戶在INSERT中為AUTO_INCREMENT列指定NULL或者0，InnoDB處理行，就彷彿值還沒有被指定，且為它生成一個新值。

自動增長計數器被初始化之後，如果用戶插入一個明確指定該列值的行，而且該值大於當前計數器值，則計數器被設置為指定列值。如果沒有明確指定一個值，InnoDB給計數器增加一，並且賦新值給該列。

當訪問自動增長計數器之時，InnoDB使用專用的資料表級的AUTO-INC鎖定，該鎖持續到當前SQL語句的結束而不是到業務的結束。引入了專用鎖釋放策略，來為對一個含AUTO_INCREMENT列的資料表的插入改善部署。兩個事務不能同時對同一資料表有AUTO-INC鎖定。

注意，如果您回滾從計數器獲得數的事務，您可能會在賦給AUTO_INCREMENT列的值的序列中發現間隙。

如果用戶給列賦一個賦值，或者，如果值大過可被以指定整數格式儲存的最大整數，自動增長機制的行為不被定義。

在CREATE TABLE和ALTER TABLE語句中，InnoDB支援AUTO_INCREMENT = n 資料表選項來設置計數器初始值或變更當前計數器值。因在本節早先討論的原因，這個選項的影響在伺服器重啟後就無效了。

15.2.6.4.外部鍵約束

InnoDB也支援外部鍵約束。InnoDB中對外部鍵約束定義的語法看起來如下：

[CONSTRAINT symbol] FOREIGN KEY [id] (index_col_name, ...)

    REFERENCES tbl_name (index_col_name, ...)

    [ON DELETE {RESTRICT | CASCADE | SET NULL | NO ACTION}]

    [ON UPDATE {RESTRICT | CASCADE | SET NULL | NO ACTION}]

外部鍵定義服從下列情況：

· 所有tables必須是InnoDB型，它們不能是臨時資料表。

· 在引用資料表中，必須有一個索引，外部鍵列以同樣的順序被列在其中作為第一列。這樣一個索引如果不存在，它必須在引用資料表裡被自動建立。

· 在引用資料表中，必須有一個索引，被引用的列以同樣的順序被列在其中作為第一列。

· 不支援對外部鍵列的索引前綴。這樣的後果之一是BLOB和TEXT列不被包括在一個外部鍵中，這是因為對這些列的索引必須總是包含一個前綴長度。

· 如果CONSTRAINTsymbol被給出，它在資料庫裡必須是唯一的。如果它沒有被給出，InnoDB自動建立這個名字。

InnoDB拒絕任何試著在子資料表建立一個外部鍵值而不匹配在父資料表中的候選鍵值的INSERT或UPDATE操作。一個父資料表有一些匹配的行的子資料表，InnoDB對任何試圖更新或刪除該父資料表中候選鍵值的UPDATE或DELETE操作有所動作，這個動作取決於用FOREIGN KEY子句的ON UPDATE和ON DETETE子句指定的referential action。當用戶試圖從一個父資料表刪除或更新一行之時，且在子資料表中有一個或多個匹配的行，InnoDB根據要採取的動作有五個選擇：

· CASCADE: 從父資料表刪除或更新且自動刪除或更新子資料表中匹配的行。ON DELETE CASCADE和ON UPDATE CASCADE都可用。在兩個資料表之間，您不應定義若干在父資料表或子資料表中的同一列採取動作的ON UPDATE CASCADE子句。

· SET NULL: 從父資料表刪除或更新行，並設置子資料表中的外部鍵列為NULL。如果外部鍵列沒有指定NOT NULL限定詞，這就是唯一合法的。ON DELETE SET NULL和ON UPDATE SET NULL子句被支援。

· NO ACTION: 在ANSI SQL-92標準中，NO ACTION意味這不採取動作，就是如果有一個相關的外部鍵值在被參考的資料表裡，刪除或更新主要鍵值的企圖不被允許進行（Gruber, 掌握SQL, 2000:181）。 InnoDB拒絕對父資料表的刪除或更新操作。

· RESTRICT: 拒絕對父資料表的刪除或更新操作。NO ACTION和RESTRICT都一樣，刪除ON DELETE或ON UPDATE子句。（一些資料庫系統有延期檢查，並且NO ACTION是一個延期檢查。在MySQL中，外部鍵約束是被立即檢查的，所以NO ACTION和RESTRICT是同樣的）。

· SET DEFAULT: 這個動作被解析程式識別，但InnoDB拒絕包含ON DELETE SET DEFAULT或ON UPDATE SET DEFAULT子句的資料表定義。

當父資料表中的候選鍵被更新的時候，InnoDB支援同樣選擇。選擇CASCADE，在子資料表中的外部鍵列被設置為父資料表中候選鍵的新值。以同樣的方式，如果在子資料表更新的列參考在另一個資料表中的外部鍵，更新級聯。

注意，InnoDB支援外部鍵在一個資料表內引用，在這些情況下，子資料表實際上意味這在資料表內附屬的記錄。

InnoDB需要對外部鍵和被引用鍵的索引以便外部鍵檢查可以快速進行且不需要一個資料表掃瞄。對外部鍵的索引被自動建立。這是相對於一些老版本，在老版本中索引必須明確建立，否則外部鍵約束的建立會失敗。

在InnoDB內，外部鍵裡和被引用列裡相應的列必須有類似的內部數據類型，以便它們不需類型轉換就可被比較。整數類型的大小和符號必須相同。字串類型的長度不需要相同。如果您指定一個SET NULL動作，請確認您沒有在子資料表中宣告該列為為NOT NULL。

如果MySQL從CREATE TABLE語句報告一個錯誤號1005，並且錯誤訊息字串指向errno 150，這意思是因為一個外部鍵約束被不正確形成，資料表建立失敗。類似地，如果ALTER TABLE失敗，且它指向errno 150，那意味著對已變更的資料表，外部鍵定義會被不正確的形成。您可以使用SHOW INNODB STATUS來顯示一個對伺服器上最近的InnoDB外部鍵錯誤的詳細解釋。

註釋：InnoDB不對那些外部鍵或包含NULL列的被引用鍵值檢查外部鍵約束。

對SQL標準的背離：如果在父資料表內有數個行，其中有相同的被引用鍵值，然後InnoDB在外部鍵檢查中採取動作，就彷彿其它有相同鍵值的父行不存在一樣。例如，如果您已定義一個RESTRICT類型的約束，並且有一個帶數個父行的子行，InnoDB不允許任何對這些父行的刪除。

居於對應外部鍵約束的索引內的記錄，InnoDB通過深度優先選法施行級聯操作。

對SQL標準的背離： 如果ON UPDATE CASCADE或ON UPDATE SET NULL遞歸更新相同的資料表，之前在級聯過程中該資料表一被更新過，它就像RESTRICT一樣動作。這意味著您不能使用自引用ON UPDATE CASCADE或者ON UPDATE SET NULL操作。這將阻止級聯更新導致的無限循環。另一方面，一個自引用的ON DELETE SET NULL是有可能的，就像一個自引用ON DELETE CASCADE一樣。級聯操作不可以被嵌套超過15層深。

對SQL標準的背離： 類似一般的MySQL，在一個插入，刪除或更新許多行的SQL語句內，InnoDB逐行檢查UNIQUE和FOREIGN KEY約束。按照SQL的標準，預設的行為應被延遲檢查，即約束僅在整個SQL語句被處理之後才被檢查。直到InnoDB實現延遲的約束檢查之前，一些事情是不可能的，比如刪除一個通過外部鍵參考到自身的記錄。

註釋：當前，觸發器不被級聯外部鍵的動作激活。

一個通過單列外部鍵聯繫起父資料表和子資料表的簡單例子如下：

CREATE TABLE parent(id INT NOT NULL,

                    PRIMARY KEY (id)

) TYPE=INNODB;

CREATE TABLE child(id INT, parent_id INT,

                   INDEX par_ind (parent_id),

                   FOREIGN KEY (parent_id) REFERENCES parent(id)

                     ON DELETE CASCADE

) TYPE=INNODB;

如下是一個更複雜的例子，其中一個product_order資料表對其它兩個資料表有外部鍵。一個外部鍵引用一個product資料表中的雙列索引。另一個引用在customer資料表中的單行索引：

CREATE TABLE product (category INT NOT NULL, id INT NOT NULL,

                      price DECIMAL,

                      PRIMARY KEY(category, id)) TYPE=INNODB;

CREATE TABLE customer (id INT NOT NULL,

                      PRIMARY KEY (id)) TYPE=INNODB;

CREATE TABLE product_order (no INT NOT NULL AUTO_INCREMENT,

                      product_category INT NOT NULL,

                      product_id INT NOT NULL,

                      customer_id INT NOT NULL,

                      PRIMARY KEY(no),

                      INDEX (product_category, product_id),

                      FOREIGN KEY (product_category, product_id)

                        REFERENCES product(category, id)

                        ON UPDATE CASCADE ON DELETE RESTRICT,

                      INDEX (customer_id),

                      FOREIGN KEY (customer_id)

                        REFERENCES customer(id)) TYPE=INNODB;

InnoDB允許您用ALTER TABLE往一個資料表中新增一個新的外部鍵約束：

ALTER TABLE yourtablename

    ADD [CONSTRAINT symbol] FOREIGN KEY [id] (index_col_name, ...)

    REFERENCES tbl_name (index_col_name, ...)

    [ON DELETE {RESTRICT | CASCADE | SET NULL | NO ACTION}]

    [ON UPDATE {RESTRICT | CASCADE | SET NULL | NO ACTION}]

記住先建立需要的索引。您也可以用ALTER TABLE往一個資料表新增一個自引用外部鍵約束。

InnoDB也支援使用ALTER TABLE來移除外部鍵：

ALTER TABLE yourtablename DROP FOREIGN KEY fk_symbol;

當年建立一個外部鍵之時，如果FOREIGN KEY子句包括一個CONSTRAINT名字，您可以引用那個名字來移除外部鍵。另外，當外部鍵被建立之時，fk_symbol值被InnoDB內部保證。當您想要移除一個外部鍵之時，要找出標記，請使用SHOW CREATE TABLE語句。例子如下：

mysql> SHOW CREATE TABLE ibtest11c\G

*************************** 1. row ***************************

       Table: ibtest11c

Create Table: CREATE TABLE `ibtest11c` (

  `A` int(11) NOT NULL auto_increment,

  `D` int(11) NOT NULL default '0',

  `B` varchar(200) NOT NULL default '',

  `C` varchar(175) default NULL,

  PRIMARY KEY  (`A`,`D`,`B`),

  KEY `B` (`B`,`C`),

  KEY `C` (`C`),

  CONSTRAINT `0_38775` FOREIGN KEY (`A`, `D`)

REFERENCES `ibtest11a` (`A`, `D`)

ON DELETE CASCADE ON UPDATE CASCADE,

  CONSTRAINT `0_38776` FOREIGN KEY (`B`, `C`)

REFERENCES `ibtest11a` (`B`, `C`)

ON DELETE CASCADE ON UPDATE CASCADE

) ENGINE=INNODB CHARSET=latin1

1 row in set (0.01 sec)

mysql> ALTER TABLE ibtest11c DROP FOREIGN KEY 0_38775;

InnoDB解析程式允許您在FOREIGN KEY ... REFERENCES ...子句中用`（backticks)把資料表和列名名字圍起來。InnoDB解析程式也考慮到lower_case_table_names系統變數的設置。

InnoDB返回一個資料表的外部鍵定義作為SHOW CREATE TABLE語句輸出的一部分：

SHOW CREATE TABLE tbl_name;

從這個版本起，mysqldump也將資料表的正確定義生成到轉儲檔案中，且並不忘記外部鍵。

您可以如下對一個資料表顯示外部鍵約束：

SHOW TABLE STATUS FROM db_name LIKE 'tbl_name';

外部鍵約束被列在輸出的Comment列。

當執行外部鍵檢查之時，InnoDB對它照看著的子或父記錄設置共享的行級鎖。InnoDB立即檢查外部鍵約束，檢查不對事務提交延遲。

要使得對有外部鍵關係的資料表重新載入轉儲檔案變得更容易，mysqldump自動在轉儲輸出中包括一個語句設置FOREIGN_KEY_CHECKS為0。這避免在轉儲被重新裝載之時，與不得不被以特別順序重新裝載的資料表相關的問題。也可以手動設置這個變數：

mysql> SET FOREIGN_KEY_CHECKS = 0;

mysql> SOURCE dump_file_name;

mysql> SET FOREIGN_KEY_CHECKS = 1;

如果轉儲檔案包含對外部鍵是不正確順序的資料表，這就以任何順序導入該資料表。這樣也加快導入操作。設置FOREIGN_KEY_CHECKS為0，對於在LOAD DATA和ALTER TABLE操作中忽略外部鍵限制也是非常有用的。

InnoDB不允許您刪除一個被FOREIGN KEY資料表約束引用的資料表，除非您做設置SET FOREIGN_KEY_CHECKS=0。當您移除一個資料表的時候，在它的建立語句裡定義的約束也被移除。

如果您重新建立一個被移除的資料表，它必須有一個遵從於也引用它的外部鍵約束的定義。它必須有正確的列名和類型，並且如前所述，它必須對被引用的鍵有索引。如果這些不被滿足，MySQL返回錯誤號1005 並在錯誤訊息字串中指向errno 150。

15.2.6.5. InnoDB和MySQL複製

MySQL複製就像對MyISAM資料表一樣，也對InnoDB資料表起作用。以某種方式使用複製也是可能的，在這種方式中從伺服器上資料表的類型不同於主伺服器上原始資料表的類型。例如，您可以複製修改到主伺服器上一個InnoDB資料表，到從伺服器上一個MyISAM資料表裡。

要為一個主伺服器建立一個新伺服器，您不得不複製InnoDB資料表空間和日誌檔案，以及InnoDB資料表的.frm檔案，並且移動復件到從伺服器。關於其恰當步驟請參閱15.2.9節，「移動InnoDB資料庫到另一台機器”。

如果您可以關閉主伺服器或者一個存在的從伺服器。您可以採取InnoDB資料表空間和日誌檔案的冷備份，並用它來建立一個從伺服器。要不關閉任何伺服器來建立一個新的從伺服器，您也可以使用非免費（商業的）InnoDB熱備份工具。

InnoDB複製裡一個小的限制是LOAD TABLE FROM MASTER不對InnoDB類型資料表起作用。有兩種可能的工作區：

· 轉儲主伺服器上的資料表並導入轉儲檔案到從伺服器。

· 在用LOAD TABLE tbl_name FROM MASTER建立複製之前，在主伺服器上使用ALTER TABLE tbl_name TYPE=MyISAM，並且隨後使用ALTER TABLE把主資料表轉換回InnoDB。

在主伺服器失敗的事務根本不影響複製。MySQL複製基於二進制日誌，MySQ在那裡寫修改數據的SQL語句。從伺服器讀主伺服器的二進制日誌，並執行同樣的SQL語句。儘管如此，在事務裡發生的語句不被寫進二進制日誌直到事務提交，在那一刻，事務裡所有語句被一次性寫進日誌。如果語句失敗了，比如，因為外部鍵違例，或者，如果事務被回滾，沒有SQL語句被寫進二進制日誌，並且事務根本不在從伺服器上執行。

15.2.6.6. 使用Per-Table資料表空間

您可以儲存每個InnoDB資料表和它的索引在它自己的檔案在中，這個特徵被稱為“多資料表空間” ，因為實際上每個資料表有它自己的資料表空間。

對那些想把特定資料表格移到分離物理磁盤的用戶，或者那些希望快速恢復單個資料表的備份而無須打斷其餘InnoDB資料表的使用的用戶，使用多資料表空間會是有益的。

您可以往my.cnf的[mysqld]節新增下面行來允許多資料表空間：

[mysqld]

innodb_file_per_table

重啟伺服器之後，InnoDB儲存每個新建立的資料表到資料表格所屬於的資料庫目錄下它自己的檔案tbl_name.ibd裡。這類似於MyISAM儲存引擎所做的，但MyISAM 把資料表分成數據檔案tbl_name.MYD和索引檔案tbl_name.MYI。對於InnoDB，數據和所以被一起存到.ibd檔案。tbl_name.frm檔案照舊依然被建立。

如果您從my.cnf檔案刪除innodb_file_per_table行，並重啟伺服器，InnoDB在共享的資料表空間檔案裡再次建立資料表。

innodb_file_per_table只影響資料表的建立。如果您用這個選項啟動伺服器，新資料表被用.ibd檔案來建立，但是您仍舊能訪問在共享資料表空間裡的資料表。如果您刪掉這個選項，新資料表在共享資料表空間內建立，但您仍舊可以訪問任何用多資料表空間建立的資料表。

InnoDB總是需要共享標空間。.ibd檔案對InnoDB不足以去運行，共享資料表空間包含熟悉的ibdata檔案，InnoDB把內部數據詞典和未作日誌放在這個檔案中。

註釋：您不能像對MyISAM一樣，在數據目錄之間隨意地移動.ibd檔案。這是因為資料表定義被存在InnoDB共享資料表空間內，而且InnoDB必須保持事務ID和日誌順序號的一致性。

在一個給定的MySQL安裝裡，您可以用RENAME TABLE語句把.ibd檔案和關聯的資料表從一個資料庫移到另一個資料庫：

RENAME TABLE old_db_name.tbl_name TO new_db_name.tbl_name;

如果您有.ibd檔案的一個乾淨的備份，您可以按如下操作從被起源的地方恢復它到MySQL安裝中：

1. 發出這個ALTER TABLE語句：

2.      ALTER TABLE tbl_name DISCARD TABLESPACE;

警告：這個語句刪除當前.ibd檔案。

3. 把備份的.ibd檔案放回到恰當的資料庫目錄。

4. 發出這個ALTER TABLE語句:

5.      ALTER TABLE tbl_name IMPORT TABLESPACE;

在上下文中，一個.ibd檔案乾淨的備份意為：

· .ibd檔案裡沒有尚未提交的事務做的修改。

· .ibd檔案裡無未合併的插入混充條目。

· 淨化已經從.ibd檔案移除所有已標注刪除的索引記錄。

· mysqld已經把.ibd檔案的所有已修改頁面從緩衝池刷新到檔案。

您可以用下列方法生成一個.ibd檔案的乾淨備份：

1. 停止所有來自mysqld伺服器的活動，並提交所有事務。

2. 等待直至SHOW INNODB STATUS顯示在資料庫被已經沒有激活的事務，並且InnoDB主線程的狀態是Waiting for server activity。然後您就可以複製.ibd檔案了。

生成一個.ibd檔案的乾淨複製的另一個方法是使用商業的InnoDB熱備份工具：

1. 使用InnoDB熱備份工具備份InnoDB安裝。

2. 在備份上啟動第二個mysqld伺服器，讓它清潔備份裡的.ibd檔案。

15.2.7. 新增和刪除InnoDB數據和日誌檔案

這一節描述在InnoDB資料表空間耗盡空間之時，或者您想要改變日誌檔案大小之時，您可以做的一些事情。

最簡單的，增加InnoDB資料表空間大小的方法是從開始配置它為自動延伸的。為資料表空間定義裡的最後一個數據檔案指定autoextend屬性。然後在檔案耗盡空間之時，InnoDB以8MB為增量自動增加該檔案的大小。增加的大小可以通過設置innodb_autoextend_increment值來配置,這個值以MB為單位，預設的是8。

作為替代，您可以通過新增另一個數據檔案來增加資料表空間的尺寸。要這麼做的話，您必須停止MySQL伺服器，編輯my.cnf檔案，新增一個新數據檔案到innodb_data_file_path的末尾，然後再次啟動伺服器。

如果最後一個數據檔案是用關鍵字autoextend定義的，編輯my.cnf檔案的步驟必須考慮最後一個數據檔案已經增長到多大。獲取數據檔案的尺寸，把它四捨五入到最接近乘積1024 × 1024bytes (= 1MB)，然後在innodb_data_file_path中明確指定大致的尺寸。然後您可以新增另一個數據檔案。記得只有innodb_data_file_path裡最後一個數據可以被指定為自動延伸。

作為一個例子。假設資料表空間正好有一個自動延伸檔案ibdata1：

innodb_data_home_dir =

innodb_data_file_path = /ibdata/ibdata1:10M:autoextend

假設這個數據檔案過一段時間已經長到988MB。下面是新增另一個總延伸數據檔案之後的配置行：

innodb_data_home_dir =

innodb_data_file_path = /ibdata/ibdata1:988M;/disk2/ibdata2:50M:autoextend

當您新增一個新檔案到資料表空間的之後，請確信它並不存在。當您重啟伺服器之時，InnoDB建立並初始化這個檔案。

當前，您不能從資料表空間刪除一個數據檔案。要增加資料表空間的大小，使用如下步驟：

1. 使用mysqldump轉儲所有InnoDB資料表。

2. 停止伺服器。

3. 刪除所有已存在的資料表空間檔案。

4. 配置新資料表空間。

5. 重啟伺服器。

6. 導入轉儲檔案。

如果您想要改變您的InnoDB日誌檔案的數量和大小，您必須要停止MySQL伺服器，並確信它被無錯誤地關閉。隨後複製舊日誌檔案到一個安全的地方以防萬一某樣東西在關閉時出錯而您需要用它們來恢復資料表空間。從日誌檔案目錄刪除所有舊日誌檔案，編輯my.cnf來改變日誌檔案配置，並再次啟動MySQL伺服器。mysqld在啟動之時發現沒有日誌檔案，然後告訴您它正在建立一個新的日誌檔案。

15.2.8. 備份和恢復InnoDB資料庫

15.2.8.1. 強制恢復

15.2.8.2. 檢查點

安全資料庫管理的關鍵是定期做備份。

InnoDB熱備份工具是一個線上備份工具，您可以用它來在InnoDB資料庫運行之時備份您的InnoDB資料庫。InnoDB熱備份工具不要求您關閉資料庫，並且它不設置任何鎖定或干擾您正常的資料庫處理。InnoDB熱備份工具是非免費（商業的）附加軟件，它每年的證書費用是每台MySQL伺服器運行的計算機€390。請參閱InnoDB熱備份主頁以獲得更詳細的訊息以及屏幕截圖。

如果您可以關閉您的MySQL伺服器，您可以生成一個包含InnoDB用來管理它的資料表的所有檔案的二進制備份。使用如下步驟：

1. 關閉MySQL伺服器，確信它是無錯誤關閉。

2. 複製您所有數據檔案（ibdata檔案和.ibd檔案）到一個安全的地方。

3. 複製您所有ib_logfile檔案到一個安全的地方。

4. 複製my.cnf配置檔案或檔案到一個安全的地方。

5. 為您InnoDB資料表複製.frm檔案到一個安全的地方。

複製對InnoDB資料表起作用，所以您可以使用MySQL複製能力來在需要高可用性的資料庫站點保有一份資料庫的複製。

除了剛才描述的二進制備份，您也應該週期性地用mysqldump轉儲您的資料庫。這麼做的原因是，二進制檔案可能被破壞而您沒有注意到。轉儲的檔案被儲存成為人可讀的文本檔案，所以定點資料表的損壞修復變得更容易。再者，因為形式更簡單，嚴重數據損壞的機會就更小。mysqldump 也有一個--single-transaction選項，您可以用它來做一個一致的快照而不用把其它客戶端排除在外面。

要能夠從上述的二進制備份恢復InnoDB資料庫到現在，您必須讓二進制日誌功能打開正在運行的MySQL伺服器。然後您可以應用二進制日誌到備份資料庫以實現point-in-time恢復：

mysqlbinlog yourhostname-bin.123 | mysql

要從MySQL伺服器的崩潰恢復，唯一需要的是重新啟動它。InnoDB自動檢查日誌並執行到現在的資料庫前滾。InnoDB自動回滾在崩潰時呈現的未提交的事務。在恢復過程中，mysqld顯示如下一些輸出：

InnoDB: Database was not shut down normally.

InnoDB: Starting recovery from log files...

InnoDB: Starting log scan based on checkpoint at

InnoDB: log sequence number 0 13674004

InnoDB: Doing recovery: scanned up to log sequence number 0 13739520

InnoDB: Doing recovery: scanned up to log sequence number 0 13805056

InnoDB: Doing recovery: scanned up to log sequence number 0 13870592

InnoDB: Doing recovery: scanned up to log sequence number 0 13936128

...

InnoDB: Doing recovery: scanned up to log sequence number 0 20555264

InnoDB: Doing recovery: scanned up to log sequence number 0 20620800

InnoDB: Doing recovery: scanned up to log sequence number 0 20664692

InnoDB: 1 uncommitted transaction(s) which must be rolled back

InnoDB: Starting rollback of uncommitted transactions

InnoDB: Rolling back trx no 16745

InnoDB: Rolling back of trx no 16745 completed

InnoDB: Rollback of uncommitted transactions completed

InnoDB: Starting an apply batch of log records to the database...

InnoDB: Apply batch completed

InnoDB: Started

mysqld: ready for connections

如果資料庫被損壞或磁盤出錯，您必須從備份做恢復。在損壞的情況下，您首先應該找出一個沒有被損壞的備份。恢復資料庫備份之後，從二進制日誌檔案恢復。

在一些資料庫損壞的情況下，僅僅轉儲，移除並重建一個或數個被破壞的資料表是足夠的。您可以用CHECK TABLE SQL語句來檢查資料表是否損壞，雖然CHECK TABLE正常地不檢查每種可能的損壞，您可以使用innodb_tablespace_monitor來檢查資料表空間檔案內檔案空間管理的完整性。

在一些情況下，明顯地資料庫損壞是因為作業系統損壞它自己的檔案緩存，磁盤上的數據可能完好，最好是首先重啟計算機。它可以消除那些顯得是資料庫頁損壞的錯誤。

15.2.8.1. 強制恢復

如果資料庫頁被破壞，您可能想要用SELECT INTO OUTFILE從從資料庫轉儲您的資料表，通常以這種方法獲取的大多數數據是完好的。即使這樣，損壞可能導致SELECT * FROM tbl_name或者InnoDB後台操作崩潰或斷言，或者甚至使得InnoDB前滾恢復崩潰。儘管如此，您可以用它來強制InnoDB儲存引擎啟動同時阻止後台操作運行，以便您能轉儲您的資料表。例如：您可以在重啟伺服器之前，在選項檔案的[mysqld]節新增如下的行：

[mysqld]

innodb_force_recovery = 4

innodb_force_recovery被允許的非零值如下。一個更大的數字包含所有更小數字的預防措施。如果您能夠用一個多數是4的選項值來轉儲您的資料表，那麼您是比較安全的，只有一些在損壞的單獨頁面上的數據會丟失。一個為6的值更誇張，因為資料庫頁被留在一個陳舊的狀態，這個狀態反過來可以引發對B樹和其它資料庫結構的更多破壞。

· 1 (SRV_FORCE_IGNORE_CORRUPT)

即使伺服器檢測到一個損壞的頁，也讓伺服器運行著；試著讓SELECT * FROM tbl_name 跳過損壞的索引記錄和頁，這樣有助於轉儲資料表。

· 2 (SRV_FORCE_NO_BACKGROUND)

阻止主線程運行，如果崩潰可能在淨化操作過程中發生，這將阻止它。

· 3 (SRV_FORCE_NO_TRX_UNDO)

恢復後不運行事務回滾。

· 4 (SRV_FORCE_NO_IBUF_MERGE)

也阻止插入緩衝合併操作。如果您可能會導致一個崩潰。最好不要做這些操作，不要計算資料表統計資料表。

· 5 (SRV_FORCE_NO_UNDO_LOG_SCAN)

啟動資料庫之時不查看未完成日誌：InnoDB把未完成的事務視為已提交的。

· 6 (SRV_FORCE_NO_LOG_REDO)

不要在恢復連接中做日誌前滾。

資料庫不能另外地帶著這些選項中被允許的選項來使用。作為一個安全措施，當innodb_force_recovery被設置為大於0的值時，InnoDB阻止用戶執行INSERT, UPDATE或DELETE操作.

即使強制恢復被使用，您也可以DROP或CREATE資料表。如果您知道一個給定的資料表正在導致回滾崩潰，您可以移除它。您也可以用這個來停止由失敗的大宗導入或失敗的ALTER TABLE導致的失控回滾。您可以殺掉mysqld程序，然後設置innodb_force_recovery為3，使得資料庫被掛起而不需要回滾，然後捨棄導致失控回滾的資料表。

15.2.8.2. 檢查點

InnoDB實現一種被認識為“模糊”檢查點設置的檢查點機制。InnoDB以小批量從緩衝池刷新已修改的資料庫頁。沒必要以單個批次刷新緩衝池，單批次刷新實際操作中可能會在檢查點設置程序中停止用戶SQL語句的處理。

在崩潰恢復中，InnoDB找尋被寫進日誌的檢查點標籤。它知道所有在該標籤之前對資料庫的修改被呈現在資料庫的磁盤映像中。然後InnoDB從檢查點往前掃瞄日誌檔案，對資料庫應用已寫入日誌的修改。

InnoDB以循環方式寫日誌檔案。所有使得緩衝池裡的資料庫頁與磁盤上的映像不同的已提交修改必須出現在日誌檔案中，以備萬一InnoDB需要做一個恢復。這意味著，當InnoDB開始重新使用一個日誌檔案，它需要確認在磁盤上的資料庫頁映像包含已寫進InnoDB準備重新使用的日誌檔案裡的修改。換句話說，InnoDB必須建立一個檢查點，這經常涉及已修改資料庫頁到磁盤的刷新。

前面的敘述解釋了為什麼使您的日誌檔案非常大會在設置檢查點中節約磁盤I/O。設置日誌檔案總的大小和緩衝池一樣大或者甚至比緩衝池大通常是有意義的。大日誌檔案的缺點是崩潰恢復要花更長的時間，因為有更多寫入日誌的訊息要應用到資料庫上。

15.2.9. 把一個InnoDB資料庫移到另一台機器

在Windows上， InnoDB 總是在內部以小寫名字的方式儲存資料庫和資料表。要從Unix把二進制格式的資料庫移到Windows，或者從Windows移到Unix，您應該讓所有資料表和資料庫的名字小寫。要實現這個，一個方便的方式是在建立任何資料庫和資料表之前，在您的my.cnf或my.ini檔案的[mysqld]節內新增如下行：

[mysqld]

lower_case_table_names=1

類似於MyISAM數據檔案，InnoDB數據和日誌檔案在所有有相同浮點數格式的平台上是二進制兼容的。您可以拷貝所有列在15.2.8節，「InnoDB資料庫的備份和恢復」裡的相關檔案來簡單地移動一個InnoDB資料庫。如果浮點格式不同，但您沒有在資料表中使用FLOAT或DOUBLE數據類型，則過程是一樣：簡單地拷貝相關檔案。如果格式不容，且您的資料表包含浮點數據，您必須使用mysqldump在一台機器轉儲您的資料表，然後在另一台機器導入轉儲檔案。

假設資料表空間有足夠的空間供導入事務產生的大型回滾片斷使用，則提高性能的一個方法是在導入數據時關掉autocommit模式。僅在導入整個資料表或資料表的一個片斷之後提交。

15.2.10. InnoDB事務模型和鎖定

15.2.10.1. InnoDB鎖定模式

15.2.10.2. InnoDB和AUTOCOMMIT

15.2.10.3. InnoDB和TRANSACTION ISOLATION LEVEL

15.2.10.4. 持續非鎖定讀

15.2.10.5. 鎖定讀SELECT ... FOR UPDATE和SELECT ... LOCK IN SHARE MODE

15.2.10.6. Next-Key鎖定：避免匪夷所思的問題

15.2.10.7. 持續讀如何在InnoDB中作用的例子

15.2.10.8. 在InnoDB中用不同的SQL語句設定鎖

15.2.10.9. MySQL什麼時候提交或回滾一個事務？

15.2.10.10. 死鎖檢測＆回滾

15.2.10.11. 如何應對死鎖

在InnoDB事務模式中，目的是把多版本資料庫的最好特性與傳統的二相鎖定合併起來。InnoDB以Oracle的風格，對行級進行鎖定，並且預設運行查詢作為非鎖定持續讀。在InnoDB中鎖定的資料表被儲存得如此節省空間，以至於不需要鎖定增大：典型地，數個用戶被允許在資料庫中鎖定每一行，或者行的任何隨機子集，而InnoDB不會耗盡內存。

15.2.10.1. InnoDB鎖定模式

InnoDB實現標準行級鎖定，在這裡有兩種類型的鎖： locks:

· 共享的(S)鎖允許一個事務去讀一行（tuple）。

· 獨佔的鎖(X)允許一個事務更新或刪除一行。

如果事務A 在tuple t上持有獨佔鎖定，來自不同事務B的對t上任一類型的鎖的請求不被馬上授權，取而代之地，事務B 不得不等待事務t釋放在tuple t上的鎖。

如果事務 A 在tuple t上持有一個共享的鎖(S)，那麼

· 來自不同的事務B對在t 上X的鎖定請求不能被馬上授權。

· 來自不同的事務B對在t 上S的鎖定請求可以被馬上獲准。因此A和B持有t上的S鎖定。

不僅如此，InnoDB支援多間隔尺寸鎖定，它允許記錄鎖和對整個資料表的鎖共存。要使得多間隔尺寸級別的鎖定實際化，額外類型的鎖，被稱為intention locks被使用。在InnoDB中，意圖鎖定是資料表鎖定。對於一個事務，意圖鎖定之後理想的是指明在該資料表中對一個行隨後需要哪一類型的鎖定（共享還是獨佔）。有兩種意圖鎖被用在InnoDB中（假設事務T 在資料表R中要求一個已指出的類型的鎖）：

· 意圖共享(IS)：事務T 意圖給資料表T上單獨的tuple設置S 鎖定。

· 意圖獨佔(IX)：事務T 意圖給這些tuple設置X 鎖定。

意圖鎖協議如下：

· 在假設的事務可以獲得對某假定行的S 鎖定之前，它必須首先獲得對包含該行的資料表的一個IS 或者更強的鎖定。

· 在假設的事務可以獲得對某假定行的X 鎖定之前，它必須首先獲得對包含該行的資料表的一個IX 鎖定。

這些結果可以方便地用一個鎖類型兼容矩陣來總結：

	X	IX	S	IS
X	衝突	衝突	衝突	衝突
IX	衝突	兼容	衝突	兼容
S	衝突	衝突	兼容	兼容
IS	衝突	兼容	兼容	兼容

如果一個鎖定與現在鎖定兼容的話，它被授給一個委託事務。如果一個鎖定與現存鎖定衝突，它就不被授予一個委託事務。事務等待著直到衝突的現存鎖定被釋放掉。如果一個鎖定請求與現存鎖定相衝突，且不能被授予，因為它可能會導致死鎖，一個錯誤產生。

因此，意圖鎖定不阻礙任何東西，除了完全資料表請求（比如LOCK TABLES ... WRITE）。IX 和IS鎖定的主要目的是顯示某人正鎖定一行，或將要在資料表中鎖定一行。

下列的例子演示當鎖定請求可能會導致死鎖之時一個錯誤會如何發生。例子中包括兩個客戶端A和B。

首先客戶端A建立一個包含一個行的資料表，然後開始一個事務。在這個事務內，A通過在共享模式選擇行獲得對行的S 鎖定：

mysql> CREATE TABLE t (i INT) ENGINE = InnoDB;

Query OK, 0 rows affected (1.07 sec)

mysql> INSERT INTO t (i) VALUES(1);

Query OK, 1 row affected (0.09 sec)

mysql> START TRANSACTION;

Query OK, 0 rows affected (0.00 sec)

mysql> SELECT * FROM t WHERE i = 1 LOCK IN SHARE MODE;

+------+

| i    |

+------+

|    1 |

+------+

1 row in set (0.10 sec)

接著，客戶端B開始一個事務並嘗試從該資料表刪除行：

mysql> START TRANSACTION;

Query OK, 0 rows affected (0.00 sec)

mysql> DELETE FROM t WHERE i = 1;

刪除操作要求一個X 鎖定。因為這個鎖定不兼容客戶端A持有的S鎖定，所以X 鎖定不被允許，所以請求進入對行及客戶端阻擋的鎖定請求隊列。

最後，客戶端A也試圖從資料表中刪除該行：

mysql> DELETE FROM t WHERE i = 1;

ERROR 1213 (40001): Deadlock found when trying to get lock;

try restarting transaction

因為客戶端A需要一個X 鎖定來刪除該行，所以在這裡發生死鎖。儘管如此，鎖定請求不被允許，因為客戶端B已經有一個對X鎖定的請求並且它正等待客戶端A釋放S鎖定。因為客戶端B之前對X 鎖定的請求，被客戶端A持有的S鎖定也不能升級到X鎖定。因此，InnoDB對客戶端A產生一個錯誤，並且釋放它的鎖定。在那一點上，客戶端B的鎖定請求可以被授權，並且客戶端B從資料表中刪除行。

15.2.10.2. InnoDB和 AUTOCOMMIT

在InnoDB中，所有用戶行為都在事務內發生。如果自動提交模式被允許，每個SQL語句在它自己上形成一個單獨的事務。MySQL總是帶著允許自動提交來開始一個新連接。

如果自動提交模式被用SET AUTOCOMMIT = 0關閉，那麼我們可以認為一個用戶總是有一個事務打開著。一個SQL COMMIT或ROLLBACK語句結束當前事務並且一個新事務開始。兩個語句都釋放所有在當前事務中被設置的InnoDB鎖定。一個COMMIT語句意味著在當前事務中做的改變被生成為永久的，並且變成其它用戶可見的。一個ROLLBACK語句，在另一方面，撤銷所有當前事務做的修改。

如果連接有被允許的自動提交，通過用明確的START TRANSACTION或BEGIN語句來開始一個事務，並用COMMIT或者ROLLBACK語句來結束它，這樣用戶仍舊可以執行一個多重語句事務。

15.2.10.3. InnoDB和TRANSACTION ISOLATION LEVEL

按照SQL:1992 事務隔離級別，InnoDB預設是可重複讀的（REPEATABLE READ）。MySQL/InnoDB 提供SQL標準所描述的所有四個事務隔離級別。您可以在命令行用--transaction-isolation選項，或在選項檔案裡，為所有連接設置預設隔離級別。例如，您可以在my.inf檔案的[mysqld]節裡類似如下設置該選項：globally

[mysqld]

transaction-isolation = {READ-UNCOMMITTED | READ-COMMITTED

                         | REPEATABLE-READ | SERIALIZABLE}

用戶可以用SET TRANSACTION語句改變單個會話或者所有新進連接的隔離級別。它的語法如下：

SET [SESSION | GLOBAL] TRANSACTION ISOLATION LEVEL

                       {READ UNCOMMITTED | READ COMMITTED

                        | REPEATABLE READ | SERIALIZABLE}

注意，對--transaction-isolation選項的級別名中有連字元，但在對SET TRANSACTION語句的級別名中沒有。

預設的行為是為下一個（未開始）事務設置隔離級別。如果您使用GLOBAL關鍵字，語句在全局對從那點開始建立的所有新連接（除了不存在的連接）設置預設事務級別。您需要SUPER全縣來做這個。使用SESSION 關鍵字集為將來在當前連接上執行的事務設置預設事務級別。

任何客戶端都能自由改變會話隔離級別（甚至在事務的中間），或者為下一個事務設置隔離級別。

您可以用下列語句查詢全局和會話事務隔離級別：

SELECT @@global.tx_isolation;

SELECT @@tx_isolation;

在行級鎖定中，InnoDB使用next-key鎖定。這意味著除了索引記錄，InnoDB也可以把索引記錄前的間隙鎖定到其它用戶所做的緊接該索引記錄之前的塊插入上。一個next-key鎖定指向一個鎖定住一個索引記錄和它之前的間隙的鎖定。一個間隙鎖定指僅鎖住一些索引記錄之前的間隙的鎖定。

InnoDB中每個隔離級別的詳細描述如下：

· READ UNCOMMITTED

SELECT語句以非鎖定方式被執行，但是一個可能更早期版本的記錄會被用到。因此，使用這個隔離級別，比如，讀是不連貫的。著也被稱為“髒讀”（dirty read）。另外，這個隔離級別象READ COMMITTED一樣作用。

· READ COMMITTED

一個有些像Oracle的隔離級別。所有SELECT ... FOR UPDATE和SELECT ... LOCK IN SHARE MOD語句僅鎖定索引記錄，而不鎖定記錄前的間隙，因而允許隨意緊挨著已鎖定的記錄插入新記錄。UPDATE和DELETE語句使用一個帶唯一搜索條件的唯一的索引僅鎖定找到的索引記錄，而不包括記錄前的間隙。在範圍類型UPDATE和DELETE語句，InnoDB必須對範圍覆蓋的間隙設置next-key鎖定或間隙鎖定以及其它用戶做的塊插入。這是很必要的，因為要讓MySQL複製和恢復起作用，“幽靈行”必須被阻止掉。

持續讀行為如同在Oracle中：即使在同一事務內，每個持續讀設置並讀取它自己的新快照。請參閱15.2.10.4節，「持續非鎖定讀”。

· REPEATABLE READ

這是InnoDB的預設隔離級別。帶唯一搜索條件使用唯一索引的SELECT ... FOR UPDATE, SELECT ... LOCK IN SHARE MODE, UPDATE 和DELETE語句只鎖定找到的索引記錄，而不鎖定記錄前的間隙。用其它搜索條件，這些操作採用next-key鎖定，用next-key鎖定或者間隙鎖定鎖住搜索的索引範圍，並且阻止其它用戶的新插入。

在持續讀中，有一個與之前隔離級別重要的差別：在這個級別，在同一事務內所有持續讀讀取由第一次讀所確定的同一快照。這個慣例意味著如果您在同一事務內發出數個無格式SELECT語句，這些SELECT語句對相互之間也是持續的，請參閱15.2.10.4節，「持續非鎖定讀”。

· SERIALIZABLE

這個級別類似REPEATABLE READ，但是所有無格式SELECT語句被隱式轉換成SELECT ... LOCK IN SHARE MODE。

15.2.10.4. 持續非鎖定讀

持續讀意味著InnoDB使用它的多版本化來給一個查詢展示某個時間點處資料庫的快照。查詢看到在那個時間點之前被提交的那些確切事務做的更改，並且沒有其後的事務或未提交事務做的改變。這個規則的例外是，查詢看到發佈該查詢的事務本身所做的改變。

如果您運行在預設的REPEATABLE READ隔離級別，則在同一事務內的所有持續讀讀取由該事務中第一個這樣的讀所確立的快照。您可以通過提交當前事務並在發佈新查詢的事務之後，為您的查詢獲得一個更新鮮的快照。

持續讀是預設模式，在其中InnoDBzai在READ COMMITTED和REPEATABLE READ隔離級別處理SELECT語句。持續讀不在任何它訪問的資料表上設置鎖定，因此，其它用戶可自由地在持續讀在一個資料表上執行的同一時間修改這些資料表。

注意，持續讀不在DROP TABLE和ALTER TABLE上作用。持續讀不在DROP TABLE上作用，因為MySQL不能使用已經被移除的資料表，並且InnoDB 破壞了該資料表。持續讀不在ALTER TABLE上作用，因為它在某事務內執行，該事務建立一個新資料表，並且從舊資料表往新資料表中插入行。現在，當您重新發出持續讀之時，它不能在新資料表中看見任何行，因為它們被插入到一個在持續讀讀取的快照中不可見的事務裡。

15.2.10.5. 鎖定讀SELECT ... FOR UPDATE和SELECT ... LOCK IN SHARE MODE

在一些環境中，一個持續讀是不方便的。比如，您可能想要往資料表的子資料表裡新增一個新行，並確信該子資料表在父資料表中有一個根。下列例子顯示如何在您應用程式代碼中實現參考的完整性。

假設您使用一個持續讀去讀取父資料表並且看到資料表中子資料表的根。不能安全地往子資料表新增子行嗎？不，因為可能同時發生一些其它用戶從父資料表刪除父行，而您沒有注意到它的情況。

解決辦法是在使用LOCK IN SHARE MODE的鎖定模式執行SELECT：

SELECT * FROM parent WHERE NAME = 'Jones' LOCK IN SHARE MODE;

在共享模式執行一個讀意味著我們讀最新的可用數據，並在我們讀的行設置一個共享鎖定。共享模式鎖防止其它人更新或刪除我們已讀的行。同時，如果最新的數據屬於其它客戶端尚未提交的事務，我們等著知道那個事務被提交。我們看到前述的查詢返回父'Jones'，我們可以安全地往子資料表新增子記錄並提交我們的事務。

讓我們看另外一個例子：我們在資料表child_codes 中有一個整數計數器域，我們用該資料表給每個新增到子資料表裡的子項指派一個唯一的識別符。顯然，使用持續讀或者共享模式讀去讀取當前計數器的值並是一個好主意，因為資料庫的兩個用戶可能看到計數器的同一個值，如果兩個用戶試著用同一識別符往該資料表新增子項，就會發生一個重複鍵（duplicate-key）錯誤。

在這裡，如果兩個用戶同時讀計數器，當試圖更新計數器之時，至少它們中有一個會發生死鎖錯誤並終止，因此LOCK IN SHARE MODE並不是一個好的解決方法。

在這種情況下，有兩個好方法去實現讀計數器和增長計數器值：(1) 先更新計數器，讓計數器值增1，之後讀計數器，或者(2)用鎖定模式FOR UPDATE先讀計數器，之後計數器值增加。後一個途徑可被如下實現：

SELECT counter_field FROM child_codes FOR UPDATE;

UPDATE child_codes SET counter_field = counter_field + 1;

SELECT ... FOR UPDATE讀最新的可見數據，在每個它讀取的行設置獨佔鎖定。因此，它設置與搜索的SQL UPDATE可能會在行上設置的鎖定同樣的鎖定。

請注意，以上僅是一個SELECT ... FOR UPDATE如何起作用的例子。在MySQL中，事實上生成一個唯一識別符的特殊任務可被用對該資料表的單獨訪問來完成：

UPDATE child_codes SET counter_field = LAST_INSERT_ID(counter_field + 1);

SELECT LAST_INSERT_ID();

SELECT語句僅僅取回識別符訊息（專門對當前連接）。它不訪問任何資料表。

15.2.10.6. Next-Key鎖定：避免幽靈問題

在行級鎖定中，InnoDB 使用一個名為next-key locking的算法。InnoDB以這樣一種方式執行行級鎖定：當它搜索或掃瞄資料表的索引之時，它對遇到的索引記錄設置共享或獨佔鎖定。因此，行級鎖定事實上是索引記錄鎖定。

InnoDB對索引記錄設置的鎖定也映像索引記錄之前的“間隙”。如果一個用戶對一個索引上的記錄R有共享或獨佔的鎖定，另一個用戶不能緊接在R之前以索引的順序插入一個新索引記錄。這個間隙的鎖定被執行來防止所謂的“幽靈問題”。假設您想要從有一個標識符值大於100的子資料表讀並鎖定所有子記錄，並想著隨後在選定行中更新一些列：

SELECT * FROM child WHERE id > 100 FOR UPDATE;

假設在id列有一個索引。查詢從id大於100的第一個記錄開始掃瞄。如果設置在索引記錄上的鎖定不把在間隙生成的插入排除在外，一個新行可能與此同時被插進資料表中。如果您在同一事務內執行同樣的SELECT，您可能會在該查詢返回的結果包裡看到一個新行。這與事務的隔離原則是相反的：一個事務應該能夠運行，以便它已經讀的數據在事務過程中不改變。如果我們把一套行視為數據項，新的“幽靈”子記錄可能會違反這一隔離原則。

當InnoDB掃瞄一個索引之時，它也鎖定所以記錄中最後一個記錄之後的間隙。剛在前一個例子中發生：InnoDB設置的鎖定防止任何插入到id可能大過100的資料表。

您可以用next-key鎖定在您的應用程式上實現一個唯一性檢查：如果您以共享模式讀數據，並且沒有看到您將要插入的行的重複，則您可以安全地插入您的行，並且知道在讀過程中對您的行的繼承者設置的next-key鎖定與此同時阻止任何人對您的行插入一個重複。因此，the next-key鎖定允許您鎖住在您的資料表中並不存在的一些東西。

15.2.10.7. 持續讀如何在InnoDB中工作的例子

假設您正運行在預設的REPEATABLE READ隔離級別。當您發出一個持續讀之時，即一個普通的SELECT語句，InnoDB按照您的查詢看到的資料庫，給您的事務一個時間點。如果另一個事務在您的時間點被指定之後刪除一行並提交，您不會看見已被刪除的行。插入和更新被相似地處理。

您可以通過提交您的事務來提前您的時間點，然後做另一個SELECT。

這被稱為多版本並發控制（multi-versioned concurrency control）。

               User A                 User B

           SET AUTOCOMMIT=0;      SET AUTOCOMMIT=0;

time

|          SELECT * FROM t;

|          empty set

|                                 INSERT INTO t VALUES (1, 2);

v          SELECT * FROM t;

           empty set

                                  COMMIT;

           SELECT * FROM t;

           empty set

           COMMIT;

           SELECT * FROM t;

           ---------------------

           |    1    |    2    |

           ---------------------

           1 row in set

在這個例子中，只有當用戶B已經提交插入，並且用戶A也已經提交之時，用戶A可看見被用戶B插入的行，因此時間點是在用戶B提交之前。

如果您想看資料庫的最新狀態，您應該用READ COMMITTED隔離級別或用一個鎖定讀：

SELECT * FROM t LOCK IN SHARE MODE;

15.2.10.8. 在InnoDB中不同SQL語句設置的鎖定

在SQL查詢處理中，一個鎖定讀，一個UPDATE或一個DELETE一般地對被掃瞄的每個索引記錄設置記錄鎖定。如果在某查詢中有一個WHERE條件是沒什麼關係的，而這個查詢可能從查詢的結果包中排除行。InnoDB不記得確切的WHERE條件，但是僅知道哪個索引範圍被掃瞄。記錄鎖定是正常的next-key鎖定，它也阻止對緊接著記錄之前的間隙的插入。

如果鎖定被設置為獨佔，則InnoDB總是取回集束的索引目錄並對其設置鎖定。

如果您沒有適合查詢的索引，MySQL不得不掃瞄整個資料表來處理查詢，資料表的每行變成被鎖定的，這樣反過來阻止其它用戶的所有對資料表的插入。建立一個好的索引讓您的查詢不必要掃瞄很多行是很重要的。

· SELECT ... FROM是一個持續讀，讀取資料庫的快照並且設置不鎖定，除非事務隔離級別被設為SERIALIZABLE。對於 SERIALIZABLE級別，這個設置對它遇到的索引記錄設置共享的next-key鎖定。

· SELECT ... FROM ... LOCK IN SHARE MODE對讀遇到的所有索引記錄設置共享的next-key鎖定。

· SELECT ... FROM ... FOR UPDATE對讀遇到的所有索引記錄設置獨佔的next-key鎖定。

· INSERT INTO ... VALUES (...)對被插入的行設置獨佔鎖定。注意，這不是一個next-key鎖定，並且不阻止其它用戶在已插入行之前的間隙插入。如果發生重複鍵錯誤，對重複的索引記錄設置共享鎖定。

· 在一個資料表上初始化之前指定的AUTO_INCREMENT列之時，InnoDB在與AUTO_INCREMENT列相關聯的索引的末尾設置獨佔鎖定。在訪問自動增長計數器中，InnoDB使用專用的資料表鎖定模式AUTO-INC，其中鎖定僅持續到當前SQL語句的結束，而不是到整個事務的結束。請參閱15.2.10.2節，「InnoDB和AUTOCOMMIT”。

InnoDB取回先前初始化的AUTO_INCREMENT列的值而不設定任何鎖定。

· INSERT INTO T SELECT ... FROM S WHERE ... 對每個插入到T的行設置獨佔（非next-key）鎖定。它在S上把搜索當作一個持續讀，但是如果MySQL二進制日誌功能被打開，它就對S設置一個共享的next-key鎖定。InnoDB在後一種情況不得不設置鎖定：在從一個備份的前滾恢復中，每個SQL語句不得不以與它最初被執行的方式完全同樣的方式執行。

· CREATE TABLE ... SELECT ... 把SELECT當作一個持續讀來執行，或者帶著共享鎖定來執行，如前面的條目所述。

· 如果唯一鍵沒有衝突，REPLACE像一個插入一樣被做。另外，對必須更新的行設置一個獨佔的next-key鎖定。

· UPDATE ... WHERE ... 對搜索遇到的每個記錄設置一個獨佔的next-key鎖定。

· DELETE FROM ... WHERE ... 對搜索遇到的每個記錄設置一個獨佔的next-key鎖定。

· 如果對一個資料表定義FOREIGN KEY約束，任何需要檢查約束條件的插入，更新或刪除對它看著檢查約束的記錄設置共享行級鎖定。InnoDB在約束失敗的情況下也設置這些鎖定。

· LOCK TABLES設置資料表鎖定，但是是InnoDB層之上更高的MySQL層設置這些鎖定。如果innodb_table_locks=1並且 and AUTOCOMMIT=0，InnoDB意識到資料表鎖定，並且InnoDB之上的MySQL層知道行級鎖定。另外，InooDB的自動死鎖檢測不能檢測在這個資料表鎖定被涉及之處的死鎖。同樣，既然更高的MySQL層不知道行級鎖定，很可能對另一個用戶當前對其有行鎖定的資料表獲得一個資料表鎖定。儘管如此，這並不破壞事務的完整性，如15.2.10.10節，「死鎖檢測和回滾」中討論的一樣。請參閱15.2.16節，「對InnoDB資料表的限制”。

15.2.10.9. MySQL何時隱式提交或回滾一個事務？

MySQL以預設允許autocommit模式來開始每一個客戶端連接。當autocommit被允許之時，如果SQL語句不返回錯誤的話，MySQL在每個SQL語句之後，做一個提交。

如果您關閉autocommit模式並且關閉一個連接而不使用您的事務的明確提交，則MySQL回滾您的事務。

如果SQL語句返回一個錯誤，提交/回滾行為取決於這個錯誤。請參閱15.2.15節，「InnoDB錯誤處理”。

下列每一個語句（以及它們的任何同義詞）隱式結束一個事務，就好像在執行這個語句之前您做了一個COMMIT：

· ALTER FUNCTION, ALTER PROCEDURE, ALTER TABLE, BEGIN, CREATE DATABASE, CREATE FUNCTION, CREATE INDEX, CREATE PROCEDURE, CREATE TABLE, DROP DATABASE, DROP FUNCTION, DROP INDEX, DROP PROCEDURE, DROP TABLE, LOAD MASTER DATA, LOCK TABLES, RENAME TABLE, SET AUTOCOMMIT=1, START TRANSACTION, TRUNCATE, UNLOCK TABLES.

· UNLOCK TABLES 僅在如果任何資料表當前被鎖定之時，提交一個事務。

· 在InnoDB中的CREATE TABLE語句被作為一個單獨的事務來處理。這意味著來自用戶的ROLLBACK不撤銷用戶在事務過程中生成的CREATE TABLE語句。

事務不能被嵌套。當您發出START TRANSACTION語句或與之同義的語句之時，這是對任何當前事務隱式提交的一個結果。

15.2.10.10. 死鎖檢測和回滾

InnoDB自動檢測事務的死鎖，並回滾一個或幾個事務來防止死鎖。InnoDB試著挑選小事務來回滾，事務的大小通過被插入、更新或刪除的行的數量來確定。

如果innodb_table_locks=1 （1是預設值），InnoDB意識到資料表鎖定，其上的MySQL層知道row-level鎖定。另外InnoDB不能在MySQL LOCK TABLES設定資料表鎖定的地方或者涉及InnoDB之外的儲存引擎設置鎖定的地方檢測死鎖。您必須通過設定innodb_lock_wait_timeout系統變數的值來解決這些情況。

當InnoD執行完全的事務回滾之時，該事務的所有鎖定被釋放。儘管如此，如果單個SQL語句被因為錯誤的原因被回滾，該SQL語句設定的部分鎖定可能被保留。這是因為InnoDB以一種方式儲存行鎖定，在這種方式中它不能知道隨後的哪個鎖定是被哪個SQL語句設定的。

15.2.10.11. 如何處理死鎖

死鎖是事務型資料庫典型的問題，但是除非它們頻繁出現以至於您更本不能運行某個事務，它們一般是不危險的。正常地，您必須編寫您的應用程式使得它們總是準備如果因為死鎖而回滾一個事務就重新發出一個事務。

InnoDB使用自動行級鎖定。即使在只插入或刪除單個行的事務的情況下，您可以遇到死鎖。這是因為這些操作不是真正的“極小的”，它們自動對插入或刪除的行的（可能是數個）索引記錄設置鎖定。

您可以用下列技術對付死鎖減少它們發生的可能性：

· 用Use SHOW INNODB STATUS來確定最後一個死鎖的原因。這樣可以幫助您調節應用程式來避免死鎖。

· 總是準備著重新發出事務，如果它因為死鎖而失敗了。死鎖不危險，再試一次。

· 經常提交您的事務。小事務更少地傾向於衝突。

· 如果您正使用鎖定讀，（SELECT ... FOR UPDATE或 ... LOCK IN SHARE MODE），試著用更低的隔離級別，比如READ COMMITTED。

· 以固定的順序訪問您的資料表和行。則事務形成良好定義的查詢並且沒有死鎖。

· 新增精心選定的索引到您的資料表。則您的查詢需要掃瞄更少的索引記錄並且因此設置更少的鎖定。使用EXPLAIN SELECT來確定對於您的查詢,MySQL認為哪個索引是最適當的。

· 使用更少的鎖定。如果您可以接受允許一個SELECT從一個舊的快照返回數據，不要給它新增FOR UPDATE或LOCK IN SHARE MODE子句。這裡使用READ COMMITTED隔離級別是比較好的，因為每個在同一事務裡的持續讀從它自己新鮮的快照裡讀取。

· 如果沒有別的有幫助的了，用資料表級鎖定系列化您的事務。用LOCK TABLES對事務型資料表（如InnoDB)的正確方法是設置AUTOCOMMIT = 0 並且不使用UNLOCK TABLES直到您明確地提交了事務。例如，如果您需要寫資料表t1並從資料表t讀，您可以按如下做：

·                SET AUTOCOMMIT=0;

·                LOCK TABLES t1 WRITE, t2 READ, ...;

·                [do something with tables t1 and t2 here];

·                COMMIT;

·                UNLOCK TABLES;

資料表級鎖定使得您的事務很好地排隊，並且死鎖被避免了。

· 領一個系列化事務的方法是建立一個輔助的“semaphore” 資料表，它只包含一個單行。讓每個事務在訪問其它資料表之前更新那個行。以這種方式，所有事務以序列的方式發生。注意，InnoDB即時死鎖檢測算法也能在這種情況下起租用，因為系列化鎖定是行級鎖定。超時方法，用MySQL資料表級鎖定，必須被用來解決死鎖。

· 在應用程式中使用LOCK TABLES命令，如果AUTOCOMMIT=1,MySQL不設定InnoDB資料表鎖定。

15.2.11. InnoDB性能調節提示

15.2.11.1. SHOW INNODB STATUS和InnoDB Monitors

· 如果Unix頂層工具或者Windows任務管理器顯示，您的資料庫的工作負荷的CPU使用率小於70%，則您的工作負荷可能是磁盤綁定的，可能您正生成太多的事務和提交，或者緩衝池太小。使得緩衝池更大一些會有幫助的，但不要設置緩衝池等於或超過物理內存的80%.

· 把數個修改裹進一個事務裡。如果事務對資料庫修改，InnoDB在該事務提交時必須刷新日誌到磁盤。因為磁盤旋轉的速度至多167轉/秒，如果磁盤沒有騙作業系統的話，這就限制提交的數目為同樣的每秒167次。

· 如果您可以接受損失一些最近的已提交事務，您可以設置my.cnf檔案裡的參數innodb_flush_log_at_trx_commit為0。無論如何InnoDB試著每秒刷新一次日誌，儘管刷新不被授權。

· 使用大的日誌檔案，讓它甚至與緩衝池一樣大。當InnoDB寫滿日誌檔案時，它不得不在一個檢查點把緩衝池已修改的內容寫進磁盤。小日誌檔案導致許多不必要的吸盤寫操作。大日誌檔案的缺點時恢復時間更長。

· 也讓日誌緩衝相當大（與8MB相似的數量)。

· 如果您儲存變長度字串，或者列可能包含很多NULL值，則使用VARCHAR列類型而不是CHAR類型。一個CHAR(N)列總是佔據N 字節來儲存，即使字串更短或字串的值是NULL。越小的資料表越好地適合緩衝池並且減少磁盤I/O。

當使用row_format=compact （MySQL 5.1中預設的InnoDB記錄格式）和可變長度字元編碼，比如UTF-8或sjis，CHAR(N)將佔據可變數量的空間，至少為N 字節。

· 在一些版本的GNU/Linux和Unix上，用Unix的fsync()（InnoDB預設使用的）把檔案刷新到磁盤，並且其他相似的方法是驚人的慢。如果您不滿意資料庫的寫性能，您可以試著設置my.cnf裡的innodb_flush_method為O_DSYNC，雖然O_DSYNC在多數系統上看起來更慢。

· 當在Solaris 10上，為x86_64架構（AMD Opteron)使用InnoDB儲存引擎，重要的是使用forcedirectio選項來安裝任何為儲存與InnoDB相關的檔案而使用的數據系統。（預設在Solaris 10/x86_64上不使用這個檔案系統安裝選項）。使用forcedirectio 失敗會導致InnoDB在這個平台上的速度和性能嚴重退化。

· 當導入數據到InnoDB中之時，請確信MySQL沒有允許autocommit模式，因為允許autocommit模式會需要每次插入都要刷新日誌到磁盤。要在導入操作規程中禁止autocommit模式，用SET AUTOCOMMIT和COMMIT語句來包住導入語句：

·                SET AUTOCOMMIT=0;

·                /* SQL import statements ... */

·                COMMIT;

如果您使用mysqldump 選項--opt，即使不用SET AUTOCOMMIT和COMMIT語句來包裹，您也使得快速的轉儲檔案被導入到InnoDB資料表中。

· 小心大宗插入的大回滾：InnoDB在插入中使用插入緩衝來節約磁盤I/O，但是在相應的回滾中沒有使用這樣的機制。一個磁盤綁定的回滾可以用相應插入花費時間的30倍來執行。殺掉資料庫程序沒有是幫助的，因為回滾在伺服器啟動時會再次啟動。除掉一個失控的回滾的唯一方法是增大緩衝池使得回滾變成CPU綁定且跑得快，或者使用專用步驟，請參閱15.2.8.1節，「強制恢復”。

· 也要小心其它大的磁盤綁定操作。用DROP TABLE或CREATE TABLE來清空一個資料表，而不是用DELETE FROM tbl_name。

· 如果您需要插入許多行，則使用多行插入語法來減少客戶端和伺服器之間的通訊開支：

·                INSERT INTO yourtable VALUES (1,2), (5,5), ...;

這個提示對到任何資料表類型的插入都是合法的，不僅僅是對InnoDB類型。

· 如果您在第二個鍵上有UNIQUE約束，您可以在導入會話中暫時關閉唯一性檢查以加速資料表的導入：

·                SET UNIQUE_CHECKS=0;

對於大資料表，這節約了大量磁盤I/O，因為InnoDB可以使用它的插入緩衝來在一批內寫第二個索引記錄。

· 如果您對您的資料表有FOREIGN KEY約束，您可以在導入會話過程中通過關閉外部鍵檢查來提速資料表的導入：

·                SET FOREIGN_KEY_CHECKS=0;

對於大資料表，這可以節約大量的磁盤I/O。

· 如果您經常有對不經常更新的資料表的重發查詢，請使用查詢緩存：

·                [mysqld]

·                query_cache_type = ON

·                query_cache_size = 10M

15.2.11.1. SHOW INNODB STATUS和 InnoDB Monitors

InnoDB包含InnoDB Monitors，它打印有關InnoDB內部狀態的訊息。您可以使用SQL語句SHOW INNODB STATUS來取標準InnoDB Monitor的輸出送到您的SQL客戶端。這個訊息在性能調節時有用。（如果您正使用mysql事務SQL客戶端，如果您用\G替代通常的語句終止符分號，輸出結果會更可讀）。關於InnoDB鎖定模式的討論，請參閱15.2.10.1節，「InnoDB鎖定模式”。

mysql> SHOW INNODB STATUS\G

另一個使用InnoDB Monitors的方法時讓它們不斷寫數據到mysqld伺服器的標準輸出。在這種情況下，沒有輸出被送到客戶端。當被打開的時候，InnoDB Monitors每15秒打印一次數據。伺服器輸出通常被定向到MySQL數據目錄裡的.err日誌。這個數據在性能調節時有用。在Windows上，如果您想定向輸出到窗口而不是到日誌檔案，您必須從控制台窗口的命令行使用--console選項來啟動伺服器。

監視器輸出包括下列類型的訊息：

· 被每個激活事務持有的資料表和記錄鎖定

· 事務的鎖定等待

· 線程的信號等待

· 未解決的檔案I/O請求

· 緩衝池統計數據

· 主InnoDB線程的淨化和插入緩衝合併活動

要讓標準InnoDB Monitor寫到mysqld的標準輸出，請使用下列SQL語句：

CREATE TABLE innodb_monitor(a INT) ENGINE=INNODB;

監視器可以通過發出下列語句來被停止：

DROP TABLE innodb_monitor;

CREATE TABLE語法正是通過MySQL的SQL解析程式往InnoDB引擎傳遞命令的方法：唯一有問題的事情是資料表名字innodb_monitor及它是一個InnoDB資料表。對於InnoDB Monitor, 資料表的結構根本不相關。如果您在監視器正運行時關閉伺服器，並且您想要再次啟動監視器，您必須在可以發出新CREATE TABLE語句啟動監視器之前移除資料表。這個語法在將來的發行版本中可能會改變。

您可以以相似的方式使用innodb_lock_monitor。除了它也提供大量鎖定訊息之外，它與innodb_monitor相同。一個分離的 innodb_tablespace_monitor打印存在於資料表空間中已建立檔案片斷的一個列資料表，並且確認資料表空間分配數據結構。此外，有innodb_table_monitor，用它您可以打印InnoDB內部數據詞典的內容。

InnoDB Monitor輸出的一個例子：

mysql> SHOW INNODB STATUS\G

*************************** 1. row ***************************

Status:

=====================================

030709 13:00:59 INNODB MONITOR OUTPUT

=====================================

Per second averages calculated from the last 18 seconds

----------

SEMAPHORES

----------

OS WAIT ARRAY INFO: reservation count 413452, signal count 378357

--Thread 32782 has waited at btr0sea.c line 1477 for 0.00 seconds the semaphore:

X-lock on RW-latch at 41a28668 created in file btr0sea.c line 135

a writer (thread id 32782) has reserved it in mode wait exclusive

number of readers 1, waiters flag 1

Last time read locked in file btr0sea.c line 731

Last time write locked in file btr0sea.c line 1347

Mutex spin waits 0, rounds 0, OS waits 0

RW-shared spins 108462, OS waits 37964; RW-excl spins 681824, OS waits 375485

------------------------

LATEST FOREIGN KEY ERROR

------------------------

030709 13:00:59 Transaction:

TRANSACTION 0 290328284, ACTIVE 0 sec, process no 3195, OS thread id 34831 inser

ting

15 lock struct(s), heap size 2496, undo log entries 9

MySQL thread id 25, query id 4668733 localhost heikki update

insert into ibtest11a (D, B, C) values (5, 'khDk' ,'khDk')

Foreign key constraint fails for table test/ibtest11a:

  CONSTRAINT `0_219242` FOREIGN KEY (`A`, `D`) REFERENCES `ibtest11b` (`A`, `D`)

 ON DELETE CASCADE ON UPDATE CASCADE

Trying to add in child table, in index PRIMARY tuple:

 0: len 4; hex 80000101; asc ....;; 1: len 4; hex 80000005; asc ....;; 2: len 4;

 hex 6b68446b; asc khDk;; 3: len 6; hex 0000114e0edc; asc ...N..;; 4: len 7; hex

 00000000c3e0a7; asc .......;; 5: len 4; hex 6b68446b; asc khDk;;

But in parent table test/ibtest11b, in index PRIMARY,

the closest match we can find is record:

RECORD: info bits 0 0: len 4; hex 8000015b; asc ...[;; 1: len 4; hex 80000005; a

sc ....;; 2: len 3; hex 6b6864; asc khd;; 3: len 6; hex 0000111ef3eb; asc ......

;; 4: len 7; hex 800001001e0084; asc .......;; 5: len 3; hex 6b6864; asc khd;;

------------------------

LATEST DETECTED DEADLOCK

------------------------

030709 12:59:58

*** (1) TRANSACTION:

TRANSACTION 0 290252780, ACTIVE 1 sec, process no 3185, OS thread id 30733 inser

ting

LOCK WAIT 3 lock struct(s), heap size 320, undo log entries 146

MySQL thread id 21, query id 4553379 localhost heikki update

INSERT INTO alex1 VALUES(86, 86, 794,'aA35818','bb','c79166','d4766t','e187358f'

,'g84586','h794',date_format('2001-04-03 12:54:22','%Y-%m-%d %H:%i'),7

*** (1) WAITING FOR THIS LOCK TO BE GRANTED:

RECORD LOCKS space id 0 page no 48310 n bits 568 table test/alex1 index symbole

trx id 0 290252780 lock mode S waiting

Record lock, heap no 324 RECORD: info bits 0 0: len 7; hex 61613335383138; asc a

a35818;; 1:

*** (2) TRANSACTION:

TRANSACTION 0 290251546, ACTIVE 2 sec, process no 3190, OS thread id 32782 inser

ting

130 lock struct(s), heap size 11584, undo log entries 437

MySQL thread id 23, query id 4554396 localhost heikki update

REPLACE INTO alex1 VALUES(NULL, 32, NULL,'aa3572','','c3572','d6012t','', NULL,'

h396', NULL, NULL, 7.31,7.31,7.31,200)

*** (2) HOLDS THE LOCK(S):

RECORD LOCKS space id 0 page no 48310 n bits 568 table test/alex1 index symbole

trx id 0 290251546 lock_mode X locks rec but not gap

Record lock, heap no 324 RECORD: info bits 0 0: len 7; hex 61613335383138; asc a

a35818;; 1:

*** (2) WAITING FOR THIS LOCK TO BE GRANTED:

RECORD LOCKS space id 0 page no 48310 n bits 568 table test/alex1 index symbole

trx id 0 290251546 lock_mode X locks gap before rec insert intention waiting

Record lock, heap no 82 RECORD: info bits 0 0: len 7; hex 61613335373230; asc aa

35720;; 1:

*** WE ROLL BACK TRANSACTION (1)

------------

TRANSACTIONS

------------

Trx id counter 0 290328385

Purge done for trx's n:o < 0 290315608 undo n:o < 0 17

Total number of lock structs in row lock hash table 70

LIST OF TRANSACTIONS FOR EACH SESSION:

---TRANSACTION 0 0, not started, process no 3491, OS thread id 42002

MySQL thread id 32, query id 4668737 localhost heikki

show innodb status

---TRANSACTION 0 290328384, ACTIVE 0 sec, process no 3205, OS thread id 38929 in

serting

1 lock struct(s), heap size 320

MySQL thread id 29, query id 4668736 localhost heikki update

insert into speedc values (1519229,1, 'hgjhjgghggjgjgjgjgjggjgjgjgjgjgggjgjgjlhh

gghggggghhjhghgggggghjhghghghghghhhhghghghjhhjghjghjkghjghjghjghjfhjfh

---TRANSACTION 0 290328383, ACTIVE 0 sec, process no 3180, OS thread id 28684 co

mmitting

1 lock struct(s), heap size 320, undo log entries 1

MySQL thread id 19, query id 4668734 localhost heikki update

insert into speedcm values (1603393,1, 'hgjhjgghggjgjgjgjgjggjgjgjgjgjgggjgjgjlh

hgghggggghhjhghgggggghjhghghghghghhhhghghghjhhjghjghjkghjghjghjghjfhjf

---TRANSACTION 0 290328327, ACTIVE 0 sec, process no 3200, OS thread id 36880 st

arting index read

LOCK WAIT 2 lock struct(s), heap size 320

MySQL thread id 27, query id 4668644 localhost heikki Searching rows for update

update ibtest11a set B = 'kHdkkkk' where A = 89572

------- TRX HAS BEEN WAITING 0 SEC FOR THIS LOCK TO BE GRANTED:

RECORD LOCKS space id 0 page no 65556 n bits 232 table test/ibtest11a index PRIM

ARY trx id 0 290328327 lock_mode X waiting

Record lock, heap no 1 RECORD: info bits 0 0: len 9; hex 73757072656d756d00; asc

 supremum.;;

------------------

---TRANSACTION 0 290328284, ACTIVE 0 sec, process no 3195, OS thread id 34831 ro

llback of SQL statement

ROLLING BACK 14 lock struct(s), heap size 2496, undo log entries 9

MySQL thread id 25, query id 4668733 localhost heikki update

insert into ibtest11a (D, B, C) values (5, 'khDk' ,'khDk')

---TRANSACTION 0 290327208, ACTIVE 1 sec, process no 3190, OS thread id 32782

58 lock struct(s), heap size 5504, undo log entries 159

MySQL thread id 23, query id 4668732 localhost heikki update

REPLACE INTO alex1 VALUES(86, 46, 538,'aa95666','bb','c95666','d9486t','e200498f

','g86814','h538',date_format('2001-04-03 12:54:22','%Y-%m-%d %H:%i'),

---TRANSACTION 0 290323325, ACTIVE 3 sec, process no 3185, OS thread id 30733 in

serting

4 lock struct(s), heap size 1024, undo log entries 165

MySQL thread id 21, query id 4668735 localhost heikki update

INSERT INTO alex1 VALUES(NULL, 49, NULL,'aa42837','','c56319','d1719t','', NULL,

'h321', NULL, NULL, 7.31,7.31,7.31,200)

--------

FILE I/O

--------

I/O thread 0 state: waiting for i/o request (insert buffer thread)

I/O thread 1 state: waiting for i/o request (log thread)

I/O thread 2 state: waiting for i/o request (read thread)

I/O thread 3 state: waiting for i/o request (write thread)

Pending normal aio reads: 0, aio writes: 0,

 ibuf aio reads: 0, log i/o's: 0, sync i/o's: 0

Pending flushes (fsync) log: 0; buffer pool: 0

151671 OS file reads, 94747 OS file writes, 8750 OS fsyncs

25.44 reads/s, 18494 avg bytes/read, 17.55 writes/s, 2.33 fsyncs/s

-------------------------------------

INSERT BUFFER AND ADAPTIVE HASH INDEX

-------------------------------------

Ibuf for space 0: size 1, free list len 19, seg size 21,

85004 inserts, 85004 merged recs, 26669 merges

Hash table size 207619, used cells 14461, node heap has 16 buffer(s)

1877.67 hash searches/s, 5121.10 non-hash searches/s

---

LOG

---

Log sequence number 18 1212842764

Log flushed up to   18 1212665295

Last checkpoint at  18 1135877290

0 pending log writes, 0 pending chkp writes

4341 log i/o's done, 1.22 log i/o's/second

----------------------

BUFFER POOL AND MEMORY

----------------------

Total memory allocated 84966343; in additional pool allocated 1402624

Buffer pool size   3200

Free buffers       110

Database pages     3074

Modified db pages  2674

Pending reads 0

Pending writes: LRU 0, flush list 0, single page 0

Pages read 171380, created 51968, written 194688

28.72 reads/s, 20.72 creates/s, 47.55 writes/s

Buffer pool hit rate 999 / 1000

--------------

ROW OPERATIONS

--------------

0 queries inside InnoDB, 0 queries in queue

Main thread process no. 3004, id 7176, state: purging

Number of rows inserted 3738558, updated 127415, deleted 33707, read 755779

1586.13 inserts/s, 50.89 updates/s, 28.44 deletes/s, 107.88 reads/s

----------------------------

END OF INNODB MONITOR OUTPUT

============================

1 row in set (0.05 sec)

關於這個輸出一些要注意的：

· 如果TRANSACTIONS節報告鎖定等待，您的應用程式可能有鎖定競爭。輸出也幫助跟蹤事務死鎖的原因。

· SEMAPHORES節報告等待一個信號的線程和關於線程對一個互斥體或rw-lock信號需要多少次回滾或等待的統計數據。大量等待信號的線程可能是磁盤I/O的結果或者InnoDB內競爭問題的結果。競爭可能是因為查詢的嚴重並行，或者作業系統線程計劃的問題。設置innodb_thread_concurrency小於預設值在這種情況下是有幫助的。

· BUFFER POOL AND MEMORY節給您關於頁面讀寫的統計數據。您可以從這些數計算您當前的查詢正做多少檔案數據I/O操作。

· ROW OPERATIONS節顯示主線程正在做什麼。

InnoDB發送診斷輸出到stderr或檔案，而不是到stdout或者固定尺寸內存緩衝，以避免底層緩衝溢出。作為一個副效果，SHOW INNODB STATUS的輸出每15秒鐘寫到一個狀態檔案。這個檔案的名字是innodb_status.pid，其中pid 是伺服器程序ID。這個檔案在MySQL數據目錄裡建立。正常關機之時，InnoDB刪除這個檔案。如果發生不正常的關機，這些狀態檔案的實例可能被展示，而且必須被手動刪除。在移除它們之前，您可能想要檢查它們來看它們是否包含有關不正常關機的原因的有用訊息。僅在配置選項innodb_status_file=1被設置之時，innodb_status.pid檔案被建立。

15.2.12. 多版本的實施

因為InnoDB是多版本化的資料庫, 它必須保持關於資料表空間中舊版本行的訊息。這個訊息被存在名為rollback segment（在Oracle中模擬數據結構之後）的數據結構中。

內部地，InnoDB往存在資料庫中的每一行中新增兩個域。一個6字節的域說明插入或更新該行的最後一個事務的事務識別符。同時，一個刪除也被內部處理為一個更新，其中行中一個特殊的位被設置來標注該行為已刪除。每一行也包含一個稱為滾動指針的7字節域。滾動指針指向一個被寫到回滾片斷的撤銷日誌記錄。如果該行被更新，撤銷日誌記錄包含在該行被更新之前重建該行的內容必需的的訊息。

InnoDB使用在回滾片斷中的訊息來執行在事務回滾中需要的撤銷操作。它也使用這個訊息來為一個持續讀構建更早版本的行。

在回滾片斷中的撤銷日誌被分為插入和更新撤銷日誌。插入撤銷日誌僅在事務回滾中需要，且只要事務一提交就可以被丟棄。更新撤銷日誌也被用在持續讀中，而且它們僅在當前沒有被InnoDB分配給一個快照的事務之後被丟棄，這個快照在持續讀中可能會需要更新撤銷日誌的訊息來建立一個資料庫行的早期版本。

您必須記得規律地提交您的事務，包括那些只發佈持續讀的事務。否則, InnoDB不能從更新撤銷日誌丟棄數據，並且回滾片斷可能變得太大，填滿您的資料表空間。

在一個回滾片斷裡，一個撤銷日誌記錄的物理尺寸典型地小於相應的已插入行或已更新行。您可以用這個訊息來計算回滾片斷需要的空間。

在InnoDB多版本化方案中，當您用SQL語句刪除一行之時，該行沒有被從資料庫立即物理刪除掉。只有當InnoDB可以丟棄為刪除而被寫的更新撤銷日誌記錄時，InnoDB也物理地從資料庫刪除相應行和它的索引記錄。這個刪除操作被成為精華，它運行得很快，通常與做刪除的SQL語句花的時間在一個數量級。

在某一情景下，在那裡，用戶以幾乎相同的比率，小批次地在資料表中插入和刪除行，淨化線程開始滯後是可能的，並且資料表變得越來越大，使得每樣事都是磁盤綁定的而且非常慢。即使資料表僅載有10MB有用的數據，它可能變得用所有的死行佔據10GB空間。在這種情況下，節流新操作，並分配更多的資源來淨化線程可能是比較好的。啟動選項和可設置全球變數innodb_max_purge_lag就是為這個目的而存在的。請參閱15.2.4節，「InnoDB 啟動選項” 以獲得更多訊息。

15.2.13. 資料表和索引結構

MySQL為資料表把它的數據詞典訊息以.frm檔案的形式存在資料庫目錄裡，這對所有MySQL儲存引擎都是真的。但是每個InnoDB資料表在資料表空間內的InnoDB內部數據詞典裡有它自己的條目。當MySQL移除資料表或資料庫，它不得不刪除.frm檔案和InnoDB數據詞典內的相應條目。這就是為什麼您不能在資料庫之間簡單地移動.frm檔案來移動InnoDB資料表。

每個InnoDB資料表有專門索引，被稱為clustered index，對行的數據被存於其中。如果您對您的資料表定義一個PRIMARY KEY，主鍵的索引是集束索引。

如果您沒有為資料表定義PRIMARY KEY，MySQL拾取第一個僅有NOT NULL列的UNIQUE索引作為主鍵，並且InnoDB把它當作集束索引來用。如果資料表中沒有這樣一個索引，InnoDB內部產生一個集束索引，其中用InnoDB在這樣一個資料表內指定給行的行ID來排序行。行ID是一個6字節的域，它在新行被插入的時候單一地增加。因此被行ID排序的行是物理地按照插入順序排的。

通過集束索引訪問一個行是較快的，因為行數據是在索引搜索引導的同一頁面。如果資料表是巨大的，當對比於傳統解決方案，集束索引構架經常節約磁盤I/O。（在許多資料庫，數據傳統地被存在與索引記錄不同的頁）。

在InnoDB中，非集束索引裡的記錄（也稱為第二索引）包含對行的主鍵值。InnoDB用這個主鍵值來從集束索引中搜索行。注意，如果主鍵是長的，第二索引使用更多空間。

InnoDB比較CHAR和VARCHAR字串不同長度，以便在較短字串中剩下的長度被處理視為用空格補上的。

15.2.13.1. 索引的物理結構

所有InnoDB的索引是B數，其中索引記錄被儲存在樹的樹葉頁。一個索引頁的預設大小是16KB。當新記錄被插入，InnoDB試著為將來索引記錄的插入和更新留下十六分之一的空白頁。

如果索引記錄以連續的順序被插入（升序或者降序），結果索引頁大約是15/16滿。如果記錄被以隨機的順序被插入，頁面是從1/2到 15/16滿。如果索引頁的填充因子降到低於1/2，InnoDB試著搜索索引樹來釋放頁。

15.2.13.2. 緩衝插入

在資料庫應用中，主鍵是一個唯一的識別符，並且新行被以主鍵的升序來插入，這是個常見的情況。因此，到集束索引的插入不需要從一個磁盤隨機讀。

另一方面，第二索引通常是非唯一的，到第二索引的插入以相對隨機次序發生。這可能會導致大量的隨機磁盤I/O操作，而沒有一個被用在InnoDB中的專用機制。

如果一個索引記錄應該被插入到一個非唯一第二索引，InnoDB檢查第二索引頁是否在緩衝池中。如果是，InnoDB直接插入到索引頁。如果索引頁沒有在緩衝池中被發現，InnoDB插入記錄到一個專門的插入緩衝結構。插入緩衝被保持得如此小以至於它完全適合在緩衝池，並且可以非常快地做插入。

插入緩衝週期地被合併到資料庫中第二索引樹裡。把數個插入合併到索引樹的同一頁，節省磁盤I/O操作，經常地這是有可能的。據測量，插入緩衝可以提高到資料表的插入速度達15倍。

在插入事務被提交之後，插入緩衝合併可能連續發生。實際上，伺服器關閉和重啟之後，這會連續發生。（請參閱15.2.8.1節，「強制恢復”）。

當許多第二索引必須被更新之時，並且許多行已被插入之時，插入緩衝合併可能需要數個小時。在這個時間內，磁盤I/O將會增加，這樣會導致磁盤綁定查詢明顯緩慢。另一個明顯的後台I/O操作是淨化線程（請參閱15.2.12節，「實現多版本化”）。

15.2.13.3. 適應的哈希索引

如果一個資料表幾乎完全配合主內存，在其上執行查詢最快的方法就是使用哈希索引。InnoDB有一個自動機制，它監視對為一個資料表定義的索引的索引搜索。如果InnoDB注意到查詢會從建立一個哈希索引中獲益，它會自動地這麼做。

注意，哈希索引總是基於資料表上已存在的B樹索引來建立。根據InnoDB對B樹索引觀察的搜索方式，InnoDB會在為該B樹定義的任何長度的鍵的一個前綴上建立哈希索引。哈希索引可以是部分的：它不要求整個B樹索引被緩存在緩衝池。InnoDB根據需要對被經常訪問的索引的那些頁面建立哈希索引。

在某種意義上，InnoDB通過針對豐富主內存的適應的哈希索引機制來剪裁自己，更加靠近主內存資料庫的架構。

15.2.13.4. 物理記錄結構

InnoDB資料表中的記錄有如下特徵：

· InnoDB中每個索引記錄包含一個6字節的頭。這個頭被用來將連續的記錄連接在一起，並且也用在row-level鎖定中。

· 集束索引中的記錄包含對所有自行定義列的域。此外，有一個6字節的域給事務ID以及一個7字節的域給滾動指針。

· 如果沒有為一個資料表定義初級鍵，每個集束索引記錄也包含一個6字節的行ID域。

· 每個第二索引記錄也包含為集束索引鍵定義的所有域。

· 一個記錄也包含一個指向該記錄每一個域的指針，如果在一個記錄中域的總長度小於128字節，該指針時一個字節；否則就是2字節。這些指針的陣列被稱為記錄目錄。這些指針指向的區域被稱為記錄的數據部分。

· 內部地，InnoDB以固定長度格式儲存固定長度字元列，比如CHAR(10)。InnoDB從VARCHAR列截短跟蹤空間。注意，MySQL可以內部地把CHAR列轉換為VARCHAR列。請參閱13.1.5.1節，「安靜的列規格改變”。

· 一個SQL的NULL值在記錄目錄裡保留1或2字節。此外，SQL的NULL值如果被保存在可變長度列，則在記錄數據部分保留零字節。在一個固定長度列，它在記錄的數據部分保留該列的固定長度。為NULL值保留固定空間背後的動機是之後該列從NULL值到非NULL值的更新可以就地完成，且不會導致索引頁的碎片。

15.2.14.檔案空間管理和磁盤I/O

15.2.14.1. 磁盤I/O

15.2.14.2. 為資料表空間使用原始設備

15.2.14.3.檔案空間管理

15.2.14.4. 整理資料表碎片

15.2.14.1. 磁盤 I/O

InnoDB使用模擬異步磁盤I/O：InnoDB建立許多線程來處理I/O操作，比如read-ahead.

在InnoDB中有兩個read-ahead試探：

· 在連續read-ahead中，如果InnoDB注意到在資料表空間中對一個片斷的訪問方式是連續的，它就預先佈置一批資料庫頁的讀給I/O系統。

· 在隨機read-ahead中，如果InnoDB注意到資料表空間中的一些區域看起來進入完全讀進緩衝池中的處理中，它就佈置剩餘的讀到I/O系統。

InnoDB使用一個被稱為doublewrite的新穎的檔案刷新技術。它給操作體統崩潰或掉電後的恢復新增了安全，並且通過減少對fsync()操作的需要，它在多數Unix變種上改善了性能。.

Doublewrite意為在向一個數據檔案寫頁之前，InnoDB首先把它們寫到一個毗鄰的資料表空間區域，稱為doublewrite緩衝。僅在寫然後刷新到doublewrite已經完成之前，InnoDB寫頁面到它們在資料表空間中恰當的位置。如果作業系統在寫頁面的中間崩潰，在恢復過程中，InnoDB可以在隨後從doublewrite緩衝中找到頁面的一個良好複製。

15.2.14.2. 為資料表空間使用原始設備

您也可以使用原始磁盤分區作為資料表空間數據檔案。通過使用原始磁盤，您可以在Windows和一些Unix系統上執行non-buffered I/O 而無須檔案系統開支，這樣可以改善性能

當您建立一個新數據檔案之時，您必須在innodb_data_file_path裡緊接著數據檔案尺寸之後放置關鍵字newraw。分區必須至少和您指定的尺寸一樣大，注意，在InnoDB中，1MB是1024x1024字節，但是在磁盤規格中，1MB通常意為1,000,000字節。

[mysqld]

innodb_data_home_dir=

innodb_data_file_path=/dev/hdd1:3Gnewraw;/dev/hdd2:2Gnewraw

下次您啟動伺服器之時，InnoDB注意到關鍵字newraw並初始化新分區。但是仍然並不建立或改變任何InnoDB資料表。另外，當您重啟伺服器之時，InnoDB重新初始化分區，您的改變會丟失。（從3.23.44啟動，作為一個安全措施，當用newraw指定任何分區之時，InnoDB阻止用戶修改數據）。

InnoDB初始化新分區之後，停止伺服器，在對行的數據檔案規格中改變newraw：

[mysqld]

innodb_data_home_dir=

innodb_data_file_path=/dev/hdd1:5Graw;/dev/hdd2:2Graw

然後重啟動伺服器，並且InnoDB允許做改變。

在Windows上，您可以像這樣分配磁盤分區為一個數據檔案：

[mysqld]

innodb_data_home_dir=

innodb_data_file_path=//./D::10Gnewraw

對於訪問物理驅動器，//./ 相當於Windows語法的\\.\ 。

當您使用原始磁盤分區之時，確信它們有允許被用來運行MySQL伺服器的帳號讀和寫訪問的授權。

15.2.14.3.檔案空間管理

您在配置檔案中定義的數據檔案形成InnoDB的資料表空間。檔案被簡單地連起來以形成資料表空間。沒有條紋在使用。當前您不能定義您的資料表被分配到資料表空間中的位置。但是，在一個新建立的資料表中間中，InnoDB 從第一個數據檔案開始分配空間。

資料表空間包含資料庫頁，預設大小是16KB。這些頁被分組成64個連續頁的範圍。資料表空間內的檔案在InnoDB中被稱為片斷。術語“rollback segment”有一些混淆，因為它確切地包含許多資料表空間片斷。

在InnoDB中，每個索引分配兩個片斷。一個是給B樹的非樹葉節點的，另一個是給樹葉節點的。在這裡，理想的是為包含數據的樹葉節點達到更好的有序性。

當一個片斷在資料表空間內長大，InnoDB單獨地分配最先的32頁給它。此後InnoDB開始分配整個範圍給該片斷。InnoDB可以一次給一個大片斷新增多達4個範圍以確保數據良好的連續性。

在資料表空間中的一些頁包含其它頁的位圖，因此在一個InnoDB資料表空間中的一些範圍不能被整個地分配給片斷，只能作為單個頁被分配。

當您發出SHOW TABLE STATUS詢問資料表空間裡可用的自由空間之時，InnoDB報告在資料表空間中完全自由的範圍。InnoDB總是為掃除和其它內部目的保留一些範圍，這些保留的範圍不包括在自由空間裡。

當您從一個資料表中刪除數據之時，InnoDB聯繫相應的B樹索引。是否釋放單獨頁或是範圍到資料表空間取決刪除的方式，因此被釋放的空間變成對其它用戶可用，但是記住，已刪除的行僅在該行不再被事務回滾或持續讀所需要之後的一個（自動）淨化操作中被物理刪除。

15.2.14.4. 整理資料表碎片

如果有隨機插入到資料表的索引或從資料表的索引隨機刪除，索引可能變成碎片的。碎片意思是索引頁在磁盤上的物理排序並不接近頁上記錄的索引排序，或者在分配給索引的64頁塊上有許多沒有被使用的頁。

碎片的一個“同義詞”是一個資料表佔據的空間超過它應該佔據的空間的大小。確切是多少，這是很難去確定的。所有InnoDB數據和索引被存在B樹中，並且它們的填充因子可能從50%到100%。碎片的另一個“同義詞”是一個資料表掃瞄例如：

SELECT COUNT(*) FROM t WHERE a_non_indexed_column <> 12345;

花了超過它應該花的時間。（在上面的查詢中我們“欺騙”SQL最佳化器來掃瞄集束索引，而不是一個第二索引）。多數磁盤可以讀10MB/s到50MB/s，這可以被用來評估一個資料表掃瞄可以多快地運行。

如果您週期地執行“null” ALTER TABLE操作，它就可以加速索引掃瞄：

ALTER TABLE tbl_name ENGINE=INNODB

這導致MySQL重建資料表。另一個執行碎片整理操作的辦法是使用mysqldump來轉儲一個資料表到一個文本檔案，移除資料表，並重新從轉儲檔案重裝載它。

如果到一個索引的插入總是升序的，並且記錄僅從末尾被刪除，InnoDB檔案空間管理保證在索引中的碎片不會發生。

15.2.15. InnoDB錯誤處理

15.2.15.1. InnoDB錯誤代碼

15.2.15.2. 作業系統錯誤代碼

在InnoDB中錯誤處理不像SQL標準中指定的一樣。按照標準，在SQL語句過程中的任何錯誤應該導致該語句的回滾。InnoDB有時僅回滾部分語句，或者整個事務。下列條目敘述InnoDB如何執行錯誤處理：

· 如果您耗盡資料表空間中的檔案空間，您使得MySQL資料表完全錯誤，並且InnoDB返回SQL語句。

· 一個事務死鎖導致InnoDB回滾整個事務，在鎖定等待超時的情況，InnoDB僅回滾最近的SQL語句。

當一個事務回滾因為死鎖或鎖定等待超時而發生，它在事務中撤銷語句的作用。但是如果事務是用START TRANSACTION或BEGIN語句開始的，它就不撤銷該語句。進一步，SQL語句變成事務的一部分直到COMMIT, ROLLBACK或者導致暗地提交的SQL語句發生。

· 如果您沒有在語句中指定IGNORE選項，重複鍵錯誤回滾SQL語句。

· 行太長錯誤回滾SQL語句。

· 其它錯誤主要被代碼的MySQL層（在InnoDB儲存引擎級別以上）探測，它們回滾相應的SQL語句。在單個SQL語句中的回滾中鎖定不被釋放。

在暗地回滾過程中，就像在一個明確的ROLLBACK SQL命令的執行過程中一樣，SHOW PROCESSLIST在State列為有關的連接顯示Rolling back。

15.2.15.1. InnoDB錯誤代碼

下面的這個不完全列資料表是您可能遇見的常見的InnoDB專有錯誤，帶著為什麼發生的原因以及如何該解決問題的相關訊息

· 1005 (ER_CANT_CREATE_TABLE)

不能建立資料表。如果錯誤訊息字串指向errno 150，因為外部鍵約束被不正確地形成，所以資料表建立失敗。

· 1016 (ER_CANT_OPEN_FILE)

雖然對某資料表的.frm檔案存在，但不能從InnoDB數據檔案找到該InnoDB資料表。請參閱15.2.17.1節，「InnoDB數據詞典操作故障診斷和排除」。

· 1114 (ER_RECORD_FILE_FULL)

InnoDB耗盡資料表空間中的可用空間，您應該重新配置資料表空間來新增一個新數據檔案。

· 1205 (ER_LOCK_WAIT_TIMEOUT)

鎖定等待超時過期。事務被回滾。

· 1213 (ER_LOCK_DEADLOCK)

事務死鎖。您應該重運行事務。

· 1216 (ER_NO_REFERENCED_ROW)

您正試著新增一行，但沒有父行，並且一個外部鍵約束失敗。您應該先新增父行。

· 1217 (ER_ROW_IS_REFERENCED)

您正試圖刪除一個有子行的父行，並且一個外部鍵約束失敗。您應該先刪除子行。

15.2.15.2. 作業系統錯誤代碼

要打印一個作業系統錯誤號的意思，請使用MySQL分發版裡的perror程式。

下面資料表提供一些常用Linux系統錯誤代碼。更完整的列資料表請參閱Linux source code。

· 1 (EPERM)

操作不被允許

· 2 (ENOENT)

無此檔案或目錄

· 3 (ESRCH)

無此程序

· 4 (EINTR)

中斷的系統使用

· 5 (EIO)

I/O 錯誤

· 6 (ENXIO)

無此設備或地址

· 7 (E2BIG)

Arg列資料表太長

· 8 (ENOEXEC)

Exec合適錯誤

· 9 (EBADF)

壞檔案號

· 10 (ECHILD)

無子程序

· 11 (EAGAIN)

再試一次

· 12 (ENOMEM)

內存耗盡

· 13 (EACCES)

授權被否定

· 14 (EFAULT)

壞地址

· 15 (ENOTBLK)

阻止需求的設備

· 16 (EBUSY)

設備或資源忙

· 17 (EEXIST)

檔案存在

· 18 (EXDEV)

交叉設備連接

· 19 (ENODEV)

無此設備

· 20 (ENOTDIR)

不是一個目錄

· 21 (EISDIR)

是一個目錄？

· 22 (EINVAL)

非法參量

· 23 (ENFILE)

檔案資料表溢出

· 24 (EMFILE)

打開的檔案過多

· 25 (ENOTTY)

設備不適合的ioctl

· 26 (ETXTBSY)

文本檔案忙

· 27 (EFBIG)

檔案太大

· 28 (ENOSPC)

設備上沒空間了

· 29 (ESPIPE)

非法搜尋

· 30 (EROFS)

只讀檔案系統

· 31 (EMLINK)

太多連接

下列資料表提供一列常用Windows系統錯誤代碼。完整列資料表請訪問Microsoft website。

· 1 (ERROR_INVALID_FUNCTION)

不正確函數。

· 2 (ERROR_FILE_NOT_FOUND)

系統不能找到指定的檔案。

· 3 (ERROR_PATH_NOT_FOUND)

系統不能找到指定的路徑。

· 4 (ERROR_TOO_MANY_OPEN_FILES)

系統不能打開檔案。

· 5 (ERROR_ACCESS_DENIED)

訪問被拒絕。

· 6 (ERROR_INVALID_HANDLE)

句柄非法。

· 7 (ERROR_ARENA_TRASHED)

儲存控制塊被破壞。

· 8 (ERROR_NOT_ENOUGH_MEMORY)

無足夠儲存來處理這個命令。

· 9 (ERROR_INVALID_BLOCK)

儲存控制塊地址非法。

· 10 (ERROR_BAD_ENVIRONMENT)

環境不正確。

· 11 (ERROR_BAD_FORMAT)

試圖用不正確的格式裝載一個程式。

· 12 (ERROR_INVALID_ACCESS)

訪問代碼不合法。

· 13 (ERROR_INVALID_DATA)

數據不合法。

· 14 (ERROR_OUTOFMEMORY)

無足夠的儲存來完成這個操作。

· 15 (ERROR_INVALID_DRIVE)

系統不能找到指定的驅動器。

· 16 (ERROR_CURRENT_DIRECTORY)

目錄不能被刪除。

· 17 (ERROR_NOT_SAME_DEVICE)

系統不能移動此檔案到一個不同的磁盤驅動器。

· 18 (ERROR_NO_MORE_FILES)

沒有更多檔案。

· 19 (ERROR_WRITE_PROTECT)

媒質寫保護。

· 20 (ERROR_BAD_UNIT)

系統不能找到指定的設備。

· 21 (ERROR_NOT_READY)

設備未準備好。

· 22 (ERROR_BAD_COMMAND)

設備不能識別此命令。

· 23 (ERROR_CRC)

數據錯誤(循環冗余碼校驗).

· 24 (ERROR_BAD_LENGTH)

程式發出一個命令，但是命令長度不正確。

· 25 (ERROR_SEEK)

驅動器不能在磁盤上定位指定區域或磁道。

· 26 (ERROR_NOT_DOS_DISK)

指定的磁盤或軟盤不能被訪問。

· 27 (ERROR_SECTOR_NOT_FOUND)

驅動器不能找到請求的扇區。

· 28 (ERROR_OUT_OF_PAPER)

打印機缺紙。

· 29 (ERROR_WRITE_FAULT)

系統不能寫指定設備。

· 30 (ERROR_READ_FAULT)

系統不能從指定設備讀。

· 31 (ERROR_GEN_FAILURE)

附加到系統的設備不起作用。

· 32 (ERROR_SHARING_VIOLATION)

程序不能訪問檔案，因為它正被另一個程序使用。

· 33 (ERROR_LOCK_VIOLATION)

程序不能訪問檔案，因為另一個程序已經鎖定檔案的一部分。

· 34 (ERROR_WRONG_DISK)

驅動器的的磁盤不正確，請插入 %2 (卷系列號: %3) 到驅動器 %1.

· 36 (ERROR_SHARING_BUFFER_EXCEEDED)

太多檔案被打開以共享。

· 38 (ERROR_HANDLE_EOF)

到達檔案的末尾。

· 39 (ERROR_HANDLE_DISK_FULL)

磁盤已滿。

· 87 (ERROR_INVALID_PARAMETER)

參數不正確。（如果您在Windows中得到這個錯誤，並且已經在my.cnf或my.ini檔案中設置innodb_file_per_table，則新增innodb_flush_method=unbuffered到您的my.cnf或my.ini檔案）。

· 112 (ERROR_DISK_FULL)

磁盤已滿。

· 123 (ERROR_INVALID_NAME)

檔案名，目錄名或者卷標語法不正確。

· 1450 (ERROR_NO_SYSTEM_RESOURCES)

存在系統資源不夠完成請求的服務。

15.2.16. 對InnoDB資料表的限制

· 一個資料表不能包含超過1000列。

· 內部最大鍵長度是3500字節，但MySQL自己限制這個到1024字節。

· 除了VARCHAR, BLOB和TEXT列，最大行長度稍微小於資料庫頁的一半。即，最大行長度大約8000字節。LONGBLOB和LONGTEXT列必須小於4GB, 總的行長度，頁包括BLOB和TEXT列，必須小於4GB。InnoDB在行中儲存VARCHAR，BLOB或TEXT列的前768字節，餘下的儲存的分散的頁面中。

· 雖然InnoDB內部地支援行尺寸大於65535，您不能定義一個包含VARCHAR列的，合併尺寸大於65535的行。

·                mysql> CREATE TABLE t (a VARCHAR(8000), b VARCHAR(10000),

·                    -> c VARCHAR(10000), d VARCHAR(10000), e VARCHAR(10000),

·                    -> f VARCHAR(10000), g VARCHAR(10000));

·                ERROR 1118 (42000): Row size too large. The maximum row size for the

·                used table type, not counting BLOBs, is 65535. You have to change some

·                columns to TEXT or BLOBs

· 在一些更老的作業系統上，數據檔案必須小於2GB。

· InnoDB日誌檔案的合併尺寸必須小於4GB。

· 最小的資料表空間尺寸是10MB。最大的資料表空間尺寸是4,000,000,000個資料庫頁（64TB）。這也是一個資料表的最大尺寸。

· InnoDB資料表不支援FULLTEXT索引。

· ANALYZE TABLE 通過對每個索引樹做八次隨機深入並相應地更新索引集估值，這樣來計數集。注意，因為這是僅有的估值，反覆運行ANALYZE TABLE會產生不同數。這使得 ANALYZE TABLE 在 InnoDB 資料表上很快，不是百分百準確，因為它沒有考慮所有的行。

MySQL 不僅在匯合最佳化中使用索引集估值。如果一些匯合沒有以正確的方式最佳化，您可以試一下 ANALYZE TABLE 。很少有情況，ANALYZE TABLE 沒有產生對您特定的資料表足夠好的值，您可以使用 FORCE INDEX 在您查詢中來強制使用特定索引，或者設置 max_seeks_for_key 來確保MySQL在資料表掃瞄之上運行索引搜尋。請參閱5.3.3節，「伺服器系統變數”。請參閱A.6節，「最佳化器相關的問題”。

· 在Windows上，InnoDB總是內部地用小寫字母儲存資料庫和資料表名字。要把資料庫以二進制形式從Unix 移到Windows，或者從Windows移到Unix，您應該讓所有資料庫和資料表的名字都是小寫。

· 警告: 不要在MySQL資料庫內的把MySQL系統資料表從MyISAM轉為InnoDB資料表！這是一個不被支援的操作。如果您這麼做了，MySQL直到您從備份恢復舊系統資料表，或用mysql_install_db指令重建系統資料表才重啟動。

· InnoDB在資料表內不保留行的內部計數。（因為多版本化，這可能確實有些複雜）。要處理一個SELECT COUNT(*) FROM t語句，InnoDB必須掃瞄資料表的一個索引，如果這個索引不在緩衝池中，掃瞄需要花一些時間。要獲得快速計數，您不得不使用一個自己建立的計數器資料表，並讓您的應用按照它做的插入和刪除來更新它。如果您的資料表格不經常改變，使用MySQL查詢緩存時一個好的解決方案。如果大致的行數就足夠了，則SHOW TABLE STATUS也可被使用。請參閱15.2.11節，「InnoDB性能調節提示”。

· 對於AUTO_INCREMENT列，您必須總是為資料表定義一個索引，並且索引必須包含AUTO_INCREMENT列。在MyISAM資料表中，AUTO_INCREMENT列可能時多列索引的一部分。

· 當您重啟MySQL伺服器之時，InnoDB可能為一個AUTO_INCREMENT列重使用一個舊值（即，一個被賦給一個老的已回滾的事務的值）。

· 當一個AUTO_INCREMENT列用完值，InnoDB限制一個BIGINT到－9223372036854775808以及BIGINT UNSIGNED到1。儘管如此，BIGINT值有由64位，所以注意到，如果您要一秒輸入100萬個行，在BIGINT到達它上限之前，可能還需要將近30萬年。用所有其它整數類型列，產生一個重複鍵錯誤。這類似於MyISAM如何工作的，因為它主要是一般MySQL行為，並不特別關於任何儲存引擎。

· DELETE FROM tbl_name不重新生成資料表，但取而代之地刪除所有行，一個接一個地刪除。

· TRUNCATE tbl_name為InnoDB而被映射到DELETE FROM tbl_name 並且不重置AUTO_INCREMENT計數器。

· SHOW TABLE STATUS不能給出關於InnoDB資料表準確的統計數據，除了被資料表保留的物理尺寸。行計數僅是在SQL最佳化中粗略的估計。

· 在MySQL 5.1中，如果innodb_table_locks=1(1是預設值） MySQL LOCK TABLES操作在每一個資料表上獲取兩個鎖定。除了在MySQL層的資料表鎖定，它也獲得一個InnoDB資料表鎖定。舊版的MySQL不獲取InnoDB資料表鎖定，舊行為可以通過設置innodb_table_locks=0 來選擇。如果沒有InnoDB資料表鎖定被獲得，即使資料表的一些記錄被其它事務鎖定，LOCK TABLES完成。

· 所有被一個事務持有的InnoDB鎖定在該事務被提交或中止之時被釋放。因此在AUTOCOMMIT=1模式，在InnoDB資料表上使用是沒有太多意義的，因為被需求的InnoDB資料表鎖定可能會被立即釋放。

· 有時，在事務的過程中鎖定更多的資料表可能是有用的。不幸地，MySQL中的LOCK TABLES執行一個暗地的COMMIT和UNLOCK TABLES。LOCK TABLES的一個InnoDB變數已經被計劃，該計劃在事務的中間被執行。

· 為建立複製從伺服器的LOAD TABLE FROM MASTER語句對InnoDB資料表不起作用。一個工作區在主伺服器上更換資料表為MyISAM的，然後做負載，之後更換主伺服器資料表回到InnoDB中。

· 在InnoDB中預設資料庫頁的大小是16KB。通過編譯代碼，您可以在8KB到64KB之間來設置這個值。您不得不更新在univ.i源檔案中的UNIV_PAGE_SIZE和UNIV_PAGE_SIZE_SHIFT的值。

· 在MySQL 5.1中，觸發器不被級聯的外部鍵行為激活。

15.2.17. InnoDB故障診斷和排除

15.2.17.1. InnoDB數據詞典操作的錯誤診斷和排除

· 一個總的規則是，當一個操作失敗或這您懷疑有一個問題。您應該查看MySQL伺服器的錯誤日誌，該日誌典型地有一個有些像hostname.err這樣的名字，或者在Windows上是mysql.err這樣的。

· 故障診斷與排除之時，通常最好從命令提示符運行MySQL伺服器，而不是從mysqld_safe包運行，或不作為一個Windows服務來運行。您可以看mysqld打印到控制台上的內容，因此更好掌握發生了什麼。在Windows上，您必須用--console選項啟動伺服器將輸出定向到控制台窗口

· 使用InnoDB Monitors獲取關於某問題的訊息。如果問題是性能相關的，或者您的伺服器看起來被掛起，您應該使用innodb_monitor來打印InnoDB內部狀態的訊息，如果問題是關於鎖定，則使用innodb_lock_monitor。如果問題是在資料表的建立或其它數據詞典操作，使用innodb_table_monitor來打印InnoDB內部數據詞典的內容。

· 如果您猜測一個資料表被破壞，則在該資料表上運行CHECK TABLE。

15.2.17.1. InnoDB數據詞典操作錯誤診斷和排除

資料表的一個特殊問題是MySQL伺服器以.frm檔案來保存數據詞典訊息，它被放在資料庫目錄，然而InnoDB也儲存訊息到資料表空間檔案裡它自己的數據詞典裡。如果您把.frm檔案移來移去；或者，如果伺服器在數據詞典操作的中間崩潰，.frm檔案可能結束與InnoDB內部數據詞典的同步。

一個不同步的數據詞典的症狀是CREATE TABLE語句失敗。如果發生這種情況，您應該查看伺服器的錯誤日誌。如果日誌說資料表已經存在於InnoDB內部數據詞典當中，您在InnoDB資料表空間檔案內有一個孤資料表，它沒有對應的.frm檔案。錯誤訊息看起來像如下的：

InnoDB: Error: table test/parent already exists in InnoDB internal

InnoDB: data dictionary. Have you deleted the .frm file

InnoDB: and not used DROP TABLE? Have you used DROP DATABASE

InnoDB: for InnoDB tables in MySQL version <= 3.23.43?

InnoDB: See the Restrictions section of the InnoDB manual.

InnoDB: You can drop the orphaned table inside InnoDB by

InnoDB: creating an InnoDB table with the same name in another

InnoDB: database and moving the .frm file to the current database.

InnoDB: Then MySQL thinks the table exists, and DROP TABLE will

InnoDB: succeed.

您可以按照錯誤日誌裡給的指示移除一個孤資料表。如果還是不能成功地使用DROP TABLE，問題可能是因為在mysql客戶端裡的名字完成。要解決這個問題，用--disable-auto-rehash選項來啟動mysql客戶端並再次嘗試DROP TABLE 。（有名字完成打開著，mysql試著構建個資料表名字的列資料表，當一個正如描述的問題存在之時，這個列資料表就不起作用）。

不同步數據詞典的另一個“同義詞”是MySQL打印一個不能打開.InnoDB檔案的錯誤：

ERROR 1016: Can't open file: 'child2.InnoDB'. (errno: 1)

在錯誤日誌您可以發現一個類似於此的訊息：

InnoDB: Cannot find table test/child2 from the internal data dictionary

InnoDB: of InnoDB though the .frm file for the table exists. Maybe you

InnoDB: have deleted and recreated InnoDB data files but have forgotten

InnoDB: to delete the corresponding .frm files of InnoDB tables?

這意味這有一個孤單的.frm檔案，在InnoDB內沒有相對應的資料表。您可以通過手動刪除來移除這個孤單的.frm檔案。

如果MySQL在一個 ALTER TABLE操作的中間崩潰，您可以用InnoDB資料表空間內臨時孤資料表來結束。您可以用innodb_table_monitor看一個列出的資料表，名為#sql-...。如果您把資料表的名字包在`(backticks)裡，您可以在名字包含“#”字元的資料表上執行SQL語句。因此，您可以用前述的的方法象移除其它孤資料表一樣移除這樣一個孤資料表。注意，要在Unix外殼裡複製或重命名一個檔案，如果檔案名包含"#"字元，您需要把檔案名放在雙引號裡。

15.3. MERGE儲存引擎

15.3.1. MERGE資料表的問題

MERGE儲存引擎，也被認識為MRG_MyISAM引擎，是一個相同的可以被當作一個來用的MyISAM資料表的集合。“相同”意味著所有資料表同樣的列和索引訊息。您不能合併列被以不同順序列於其中的資料表，沒有恰好同樣列的資料表，或有不同順序索引的資料表。而且，任何或者所有的資料表可以用myisampack來壓縮。請參閱8.2節，「myisampack — 生成壓縮的只讀MyISAM資料表”。資料表選項的差異，比如AVG_ROW_LENGTH, MAX_ROWS或PACK_KEYS都不重要。

當您建立一個MERGE資料表之時，MySQL在磁盤上建立兩個檔案。檔案名以資料表的名字開始，並且有一個延伸名來指明檔案類型。一個.frm檔案儲存資料表定義，一個.MRG檔案包含被當作一個來用的資料表的名字。這些資料表作為MERGE資料表自身，不必要在同一個資料庫中。

您可以對資料表的集合用SELECT, DELETE, UPDATE和INSERT。您必須對您映射到一個MERGE資料表的這些資料表有SELECT, UPDATE和DELETE 的權限。

如果您DROP MERGE資料表，您僅在移除MERGE規格。底層資料表沒有受影響。

當您建立一個MERGE資料表之時，您必須指定一個UNION=(list-of-tables)子句，它說明您要把哪些資料表當作一個來用。如果您想要對MERGE資料表的插入發生在UNION列資料表中的第一個或最後一個資料表上，您可以選擇地指定一個INSERT_METHOD選項。使用FIRST或LAST值使得插入被相應地做在第一或最後一個資料表上。如果您沒有指定INSERT_METHOD選項，或您用一個NO值指定該選項。往MERGE資料表插入記錄的試圖導致錯誤。

下面例子說明如何建立一個MERGE資料表：

mysql> CREATE TABLE t1 (

    ->    a INT NOT NULL AUTO_INCREMENT PRIMARY KEY,

    ->    message CHAR(20));

mysql> CREATE TABLE t2 (

    ->    a INT NOT NULL AUTO_INCREMENT PRIMARY KEY,

    ->    message CHAR(20));

mysql> INSERT INTO t1 (message) VALUES ('Testing'),('table'),('t1');

mysql> INSERT INTO t2 (message) VALUES ('Testing'),('table'),('t2');

mysql> CREATE TABLE total (

    ->    a INT NOT NULL AUTO_INCREMENT,

    ->    message CHAR(20), INDEX(a))

    ->    TYPE=MERGE UNION=(t1,t2) INSERT_METHOD=LAST;

注意，一個列在MERGEN資料表中被索引，但沒有被宣告為一個PRIMARY KEY，因為它是在更重要的MyISAM資料表中。這是必要的，因為MERGE資料表在更重要的資料表中的設置上強制非唯一性。

建立MERGE資料表之後，您可以發出把一組資料表當作一體來操作的查詢：

mysql> SELECT * FROM total;

+---+---------+

| a | message |

+---+---------+

| 1 | Testing |

| 2 | table   |

| 3 | t1      |

| 1 | Testing |

| 2 | table   |

| 3 | t2      |

+---+---------+

注意，您也可以直接從MySQL之外直接操作.MRG檔案：

shell> cd /mysql-data-directory/current-database

shell> ls -1 t1 t2 > total.MRG

shell> mysqladmin flush-tables

要重映射一個MERGE資料表到一個不同的MyISAM資料表集，您可以執行下列之一：

· DROP MERGE資料表並且重建它。

· 使用ALTER TABLE tbl_name UNION=(...)來改變底層資料表的列資料表。

· 改變.MRG檔案，並對MERGE資料表或者所有底層資料表發出一個FLUSH TABLE語句來強制儲存引擎去讀新的定義檔案。

MERGE資料表可以幫您解決以下問題：

· 容易地管理一套日誌資料表。比如，您可以把不同月的數據放進分離的資料表中，用myisampack壓縮其中的一些，並隨後建立一個MERGE資料表來把它們當作一個來使用。

· 獲得更快的速度。您可以以一些標準來分割大的只讀資料表，然後放進不同磁盤上的單個資料表中。基於此的一個MERGE資料表可比使用大資料表要快得多。

· 執行更有效的搜索。如果您確切知道要搜索什麼，對一些查詢您可以只在被分割的資料表的其中之一來搜索，並且對其它使用MERGE。您甚至有許多不同的MERGE資料表，它們使用有重疊的資料表套。

· 執行更有效的修補。修補被映射到一個MERGE資料表中的單個資料表比修補單個大型資料表要更輕鬆。

· 即刻映射許多資料表成一個。MERGE資料表不需要維護它自己的索引，因為它使用大哥資料表的所用。因此，MERGE資料表集合是非常塊地建立或重映射。（注意，當您建立一個MERGE資料表之時，即使沒有索引被建立，您必須仍然指定索引定義）。

· 如果根據需要或按照批次，您有一組要合起來作為一個大資料表的資料表，您應該根據需要對它們建立一個MERGE資料表來替代大資料表。這樣要快得多而且節約大量的磁盤空間。

· 超過作業系統的檔案尺寸限制。每個MyISAM資料表都受制於這個限制，但是一個MyISAM資料表的集合則不然。

· 您可以通過定義一個映射到單個資料表的MERGE資料表來為一個MyISAM資料表建立一個別名或“同物異名”。這樣做應該沒有真實的可察覺的性能影響（對每個讀只有一些間接使用和memcpy()使用）。

MERGE資料表的缺點：

· 您可以對MERGE資料表使用僅相同的MyISAM資料表。

· 您不能在MERGE資料表中使用很多MyISAM功能。比如，您不能在MERGE資料表上建立FULLTEXT索引。（當然，您可以在底層MERGE 資料表上建立FULLTEXT索引，但是您不能用全文搜索來搜索MERGE資料表）。

· 如果MERGE資料表是非臨時的，所有底層MyISAM資料表也必須是永久的。如果MERGE資料表是臨時的，MyISAM資料表可以是任何臨時＆非臨時的混合。

· MERGE資料表使用更多的檔案描述符。如果是個客戶端正使用一個映射到10個資料表的MERGE資料表，伺服器使用(10*10)+10個檔案描述符。（10個數據檔案描述符給10個客戶端每人一個，並且在客戶端之間共享10個索引檔案描述符）。

· 鍵讀會更慢。當您讀一個鍵的時候，MERGE儲存引擎需要在所有底層資料表上發出一個讀以檢查哪一個接近匹配給定的鍵。如果您隨後做了一個read-next，MERGE儲存引擎需要搜索讀緩衝來找出下一個鍵。只有當一個鍵緩衝被耗盡，儲存引擎才需要讀下一個鍵塊。這使得MERGE鍵在eq_ref搜索中非常慢，但在ref搜索中不是太慢。請參閱7.2.1節，「EXPLAIN 語法(獲取SELECT相關訊息)” 以獲得更多關於eq_ref和ref的訊息。

15.3.1. MERGE資料表方面的問題

下列是已知關於MERGE資料表的問題：

· 如果您使用ALTER TABLE 來把MERGE資料表變為其它資料表類型，到底層資料表的映射就被丟失了。取而代之的，來自底層MyISAM資料表的行被複製到已更換的資料表中，該資料表隨後被指定新類型。

· REPLACE不起作用。

· 沒有WHERE子句，或者在任何被映射到一個打開的MERGE資料表上的任何一個資料表上的REPAIR TABLE，TRUNCATE TABLE, OPTIMIZE TABLE或ANALYZE TABLE，您不能使用DROP TABLE, ALTER TABLE, DELETE FROM。如果您這麼做了，MERGE資料表將仍舊指向原始資料表，這樣產生意外結果。解決這個不足最簡單的辦法是在執行任何一個這些操作之前發出一個FLUSH TABLES語句來確保沒有MERGE資料表仍舊保持打開。

· 一個MERGE資料表不能在整個資料表上維持UNIQUE約束。當您執行一個INSERT, 數據進入第一個或者最後一個MyISAM資料表（取決於INSERT_METHOD選項的值）。MySQL確保唯一鍵值在那個MyISAM資料表裡保持唯一，但不是跨集合裡所有的資料表。

· 當您建立一個MERGE資料表之時，沒有檢查去確保底層資料表的存在以及有相同的機構。當MERGE資料表被使用之時，MySQL檢查每個被映射的資料表的記錄長度是否相等，但這並不十分可靠。如果您從不相似的MyISAM資料表建立一個MERGE資料表，您非常有可能撞見奇怪的問題。

· 在MERGE資料表中的索引的順序和它的底層資料表中的索引應該一樣。如果您使用ALTER TABLE給一個被用在MERGE資料表中的資料表新增一個UNIQUE索引，然後使用ALTER TABLE在MERGE資料表上新增一個非唯一索引，如果在底層資料表上已經有一個非唯一索引，對資料表的索引排序是不同的。（這是因為ALTER TABLE把UNIQUE索引放在非唯一索引之前以利於重複鍵的快速檢測）。因此對使用這樣索引的資料表的查詢可能返回不期望的結果。

· 在Windows中，在一個被MERGE資料表使用的資料表上DROP TABLE不起作用，因為MERGE引擎的資料表映射對MySQL的更上層隱藏。因為Windows不允許已打開檔案的刪除，您首先必須刷新所有MERGE資料表（使用FLUSH TABLES）或在移除該資料表之前移除MERGE資料表。

對於MERGE儲存引擎，在http://forums.mysql.com/list.php?93上有一個專門的論壇。

15.4. MEMORY (HEAP)儲存引擎

MEMORY儲存引擎用存在內存中的內容來建立資料表。這些在以前被認識為HEAP資料表。MEMORY是一個首選的術語，雖然為向下兼容，HEAP依舊被支援。

每個MEMORY資料表和一個磁盤檔案關聯起來。檔案名由資料表的名字開始，並且由一個.frm的延伸名來指明它儲存的資料表定義。

要明確指出您想要一個MEMORY資料表，可使用ENGINE選項來指定：

CREATE TABLE t (i INT) ENGINE = MEMORY;

如它們名字所指明的，MEMORY資料表被儲存在內存中，且預設使用哈希索引。這使得它們非常快，並且對建立臨時資料表非常有用。可是，當伺服器關閉之時，所有儲存在MEMORY資料表裡的數據被丟失。因為資料表的定義被存在磁盤上的.frm檔案中，所以資料表自身繼續存在，在伺服器重啟動時它們是空的。

這個例子顯示您如何可以建立，使用並刪除一個MEMORY資料表：

mysql> CREATE TABLE test ENGINE=MEMORY

    ->     SELECT ip,SUM(downloads) AS down

    ->     FROM log_table GROUP BY ip;

mysql> SELECT COUNT(ip),AVG(down) FROM test;

mysql> DROP TABLE test;

MEMORY資料表有下列特徵：

· 給MEMORY資料表的空間被以小塊來分配。資料表對插入使用100%動態哈希來。不需要溢出區或額外部鍵空間。自由列資料表無額外的空間需求。已刪除的行被放在一個以連結的列資料表裡，並且在您往資料表裡插入新數據之時被重新使用。MEMORY資料表也沒有通常與在哈希資料表中刪除加插入相關的問題。

· MEMORY資料表可以有多達每個資料表32個索引，每個索引16列，以及500字節的最大鍵長度。

· MEMORY儲存引擎執行HASH和BTREE索引。您可以通過新增一個如下所示的USING子句為給定的索引指定一個或另一個：

·                CREATE TABLE lookup

·                    (id INT, INDEX USING HASH (id))

·                    ENGINE = MEMORY;

·                CREATE TABLE lookup

·                    (id INT, INDEX USING BTREE (id))

·                    ENGINE = MEMORY;

B樹的一般特徵和哈希索引在7.4.5節，「MySQL如何使用索引”裡描述。

· 您可以在一個MEMORY資料表中有非唯一鍵。（對哈希索引的實現，這是一個不常用的功能）。

· 您頁可以對MEMORY資料表使用INSERT DELAYED。請參閱13.2.4.2節，「INSERT DELAYED語法”

· 如果您在一個有高度鍵重複的（許多索引條目包含同一個值）MEMORY資料表上有一個哈希索引，對影響鍵值的資料表的更新及所有刪除都是明顯地慢的。這個變慢的程度比例於重複的程度（或者反比於索引cardinality）。您可以使用一個B樹索引來避免這個問題。

· MEMORY資料表使用一個固定的記錄長度格式。

· MEMORY不支援BLOB或TEXT列。

· MEMORY支援AUTO_INCREMENT列和對可包含NULL值的列的索引。

· MEMORY資料表在所有客戶端之間共享（就像其它任何非TEMPORARY資料表）。

· MEMORY資料表內容被存在內存中，內存是MEMORY資料表和伺服器在查詢處理之時的空閒中建立的內部資料表共享。可是，兩個類型的資料表不同在於MEMORY資料表不會遇到儲存轉換，而內部資料表是：

- 如果一個內部資料表變得太大，伺服器自動把它轉換為一個磁盤資料表。尺寸限制由tmp_table_size系統變數的值來確定。

- MEMORY資料表決不會轉換成磁盤資料表。要確保您不會偶爾做點傻事，您可以設置max_heap_table_size系統變數給MEMORY資料表加以最大尺寸。對於單個的資料表，您也可以在CREATE TABLE語句中指定一個MAX_ROWS資料表選項。

· 伺服器需要足夠內存來維持所有在同一時間使用的MEMORY資料表。

· 當您不再需要MEMORY資料表的內容之時，要釋放被MEMORY資料表使用的內存，您應該執行DELETE FROM或TRUNCATE TABLE，或者整個地刪除資料表（使用DROP TABLE）。

· 當MySQL伺服器啟動時，如果您想開拓MEMORY資料表，您可以使用--init-file選項。例如，您可以把INSERT INTO ... SELECT 或LOAD DATA INFILE這樣的語句放入這個檔案中以便從持久穩固的的數據源裝載資料表。請參閱5.3.1節，「mysqld 命令行選項” and 13.2.5節，「LOAD DATA INFILE 語法”。

· 如果您正使用複製，當主伺服器被關閉且重啟動之時，主伺服器的MEMORY資料表變空。可是從伺服器意識不到這些資料表已經變空，所以如果您從它們選擇數據，它就返回過時的內容。自從伺服器啟動後，當一個MEMORY資料表在主伺服器上第一次被使用之時，一個DELETE FROM語句被自動寫進主伺服器的二進制日誌，因此再次讓從伺服器與主伺服器同步。注意，即使使用這個策略，在主伺服器的重啟和它第一次使用該資料表之間的間隔中，從伺服器仍舊在資料表中有過時數據。可是，如果您使用--init-file選項於主伺服器啟動之時在其上推行MEMORY資料表。它確保這個時間間隔為零。

· 在MEMORY資料表中，一行需要的內存使用下列資料表達式來計算：

·                SUM_OVER_ALL_BTREE_KEYS(max_length_of_key + sizeof(char*) * 4)

·                + SUM_OVER_ALL_HASH_KEYS(sizeof(char*) * 2)

·                + ALIGN(length_of_row+1, sizeof(char*))

ALIGN()代資料表round-up因子，它使得行的長度為char指針大小的確切倍數。sizeof(char*)在32位機器上是4，在64位機器上是8。

對於MEMORY儲存引擎，在http://forums.mysql.com/list.php?92上有一個專門的論壇。

15.5. BDB (BerkeleyDB)儲存引擎

15.5.7. 使用BDB資料表時可能發生的錯誤

Sleepycat Software給MySQL提供Berkeley DB事務性儲存引擎。這個儲存引擎典型被簡稱為BDB。對BDB儲存引擎的支援包括在MySQL原始碼分發版裡，在MySQL-Max二進制分發版裡被激活。

BDB資料表可能有一個更大的崩潰倖存機會，並且也具有對事務COMMIT和ROLLBACK操作的能力。MySQL原始碼分發版和被補丁過可以與MySQL一起工作的BDB分發版一起提供。您不能使用一個未補丁過的BDB版本與MySQL一起工作。。

我們在MySQL AB上與Sleepycat緊密合作工作以保持MySQL/BDB接口的質量在高水平。（即使Berkeley DB其本身是非常能經受考驗和非常可靠的。MySQL接口仍然被認為是第三等質量的。我們將繼續改善和最佳化它）。

當它達到對所有涉及BDB資料表的問題的支援之時，我們答應負責幫助我們的用戶定位問題並建立可重複產生的測試案例。任何這樣的測試案例被轉交給Sleepycat，它反過來幫助我們找到並解決問題。因為這是一個二階段的操作，任何關於BDB資料表的問題我們可能要花比對其它儲存引擎稍微更長一點的時間來解決它。可是，我們期望這個過程沒有顯著的困難，因為Berkeley DB 代碼本身被用在MySQL之外許多的應用中。

要獲得關於Berkeley DB的一般訊息，請訪問Sleepycat網站，http://www.sleepycat.com/。

15.5.1. BDB支援的作業系統

當前，我們知道BDB儲存引擎支援下列作業系統：

· Linux 2.x Intel

· Sun Solaris (SPARC and x86)

· FreeBSD 4.x/5.x (x86, sparc64)

· IBM AIX 4.3.x

· SCO OpenServer

· SCO UnixWare 7.1.x

· Windows NT/2000/XP

BDB不支援下列作業系統：

· Linux 2.x Alpha

· Linux 2.x AMD64

· Linux 2.x IA-64

· Linux 2.x s390

· Mac OS X

註釋：前一個列資料表還不完全，我們收到更多訊息時我們會更新它。

如果您從支援BDB資料表的原始碼建立的MySQL，但是，當您啟動mysqld之時，發生下列錯誤，這意味著對您的架構BDB不被支援：

bdb: architecture lacks fast mutexes: applications cannot be threaded

Can't init databases

在這種情況下，您必須重建MySQL不帶BDB資料表支援或用--skip-bdb選項啟動伺服器。

15.5.2. 安裝BDB

如果您已經下載一個包括對Berkeley DB支援的的二進製版的MySQL，只要簡單地按照通常的二進制分發版安裝指令。（MySQL-Max 分發版包括BDB支援）。

如果您從原始碼建立MySQL，您可以在其它任何常用選項之外用--with-berkeley-db選項運行configure來允許支援BDB。下載一個MySQL 5.1分發版，改變位置到它的最頂層目錄，然後運行下面命令：

shell> ./configure --with-berkeley-db [other-options]

15.5.3. BDB啟動選項

下列對mysqld的選項可被用來改變BDB儲存引擎的行為：

· --bdb-home=path

BDB資料表的基礎目錄。這應該和您為--datadir使用的目錄相同。

· --bdb-lock-detect=method

BDB 鎖定檢測方式。選項值應該為DEFAULT, OLDEST, RANDOM或YOUNGEST。

· --bdb-logdir=path

BDB日誌檔案目錄。

· --bdb-no-recover

不在恢復模式啟動Berkeley DB。

· --bdb-no-sync

不同步刷新BDB日誌。這個選項不被贊成，取而代之地使用--skip-sync-bdb-logs（請參閱對--sync-bdb-logs的描述)。

· --bdb-shared-data

以多處理模式啟動Berkeley DB。（初始化Berkeley DB之時，不要使用DB_PRIVATE）。

· --bdb-tmpdir=path

BDB臨時檔案目錄。

· --skip-bdb

禁止BDB儲存引擎。

· --sync-bdb-logs

同步刷新BDB日誌。這個選項預設被允許，請使用--skip-sync-bdb-logs來禁止它。

請參閱5.3.1節，「mysqld命令行選項”。

如果您使用--skip-bdb選項，MySQL不初始化Berkeley DB庫，而且這樣節省大量的內存。儘管如此，如果您使用這個選項，您不能使用BDB資料表。如果您試著建立一個BDB資料表，MySQL取而代之地建立一個MyISAM。

通常，如果你像使用BDB資料表，您應該不用--bdb-no-recover選項啟動mysqld。可是，如果BDB日誌被破壞則當您試著啟動mysqld時，上述辦法啟動伺服器可能導致問題。請參閱2.9.2.3節，「MySQL伺服器的啟動和故障診斷排除”。

使用bdb_max_lock 變數，您可以指定在BDB資料表上被激活的鎖定的最大數目。預設值是10,000。當您執行長事務或當mysqld不得不檢查許多行來執行一個查詢之時，如果發生如下錯誤，您應該增加這個數目：

bdb: Lock table is out of available locks

Got error 12 from ...

如果您正使用大型多語句事務，您可能也想改變binlog_cache_size和max_binlog_cache_size變數。請參閱5.11.3節，「二進制日誌”。

也請參閱5.3.3節，「伺服器系統變數”。

15.5.4. BDB資料表的特徵

每個BDB資料表用兩個檔案被存在磁盤上。檔案的名字用資料表的名字做開頭，並且有一個延伸名來指明檔案類型。一個.frm檔案儲存資料表定義，一個.db檔案包含資料表數據和索引。

要明確指出您想要一個BDB資料表，用ENGINE或TYPE資料表選項來指明：

CREATE TABLE t (i INT) ENGINE = BDB;

CREATE TABLE t (i INT) TYPE = BDB;

BerkeleyDB是用ENGINE或者TYPE選項的BDB儲存引擎的“同義詞”。

BDB儲存引擎提供事務性資料表，您使用這些資料表的方法取決於autocommit模式：

· 如果您正運行著，同時隨著autocommit的被允許（這是預設的），對BDB資料表的改變被立即提交並且不能被回滾。

· 如果您正運行著，同時隨著autocommit的被禁止，改變不變成永久的直到您執行一個COMMIT語句。作為提交的替代，您可以執行ROLLBACK來忘記改變。

您可以用BEGIN WORK語句開始一個事務來掛起autocommit，或者用SET AUTOCOMMIT=0來明確禁止autocommit。

請參閱13.4.1節，「START TRANSACTION, COMMIT和ROLLBACK語法”。

BDB儲存引擎有下列特徵：

· BDB資料表可以有多達每資料表31個索引，每個索引16列，並且1024字節的最大鍵尺寸。

· MySQL在每個BDB資料表中需要一個PRIMARY KEY以便每一行可以被唯一地識別。如果您不明確建立一個，MySQL為您建立並維持一個隱藏的PRIMARY KEY。隱藏的鍵有一個5字節的長度，並且為每個插入的企圖而被增加。這個鍵不出現在SHOW CREATE TABLE或DESCRIBE的輸出之中。

· PRIMARY KEY比任何其它索引都要快，因為PRIMARY KEY被與行的數據一起儲存。其它索引被儲存為鍵數據＋PRIMARY KEY，所以保持PRIMARY KEY盡可能地短以節約磁盤空間並獲得更好速度是重要的。

這個行為類似於InnoDB的，在其中較短的primary keys不僅在主索引也在第二索引節約空間。

· 如果在BDB資料表中，您訪問的所有列是同一索引的一部分或主鍵的一部分，MySQL可以執行查詢而不訪問確實的行。在一個MyISAM資料表中，只有列是同一索引的一部分之時，才可以這麼做。

· 連續掃瞄比對MyISAM資料表的掃瞄更慢，因為在BDB資料表中的數據被儲存在B樹而不是在分離的數據檔案中。

· 鍵值象MyISAM資料表中的鍵值一樣不是前綴或後綴壓縮的。換句話說，在BDB資料表中鍵訊息只比在MyISAM資料表中稍微多佔據一點空間。

· 在BDB資料表中經常有洞允許您在索引樹的中間插入新行。這個使得BDB資料表比MyISAM資料表稍微大一些

· SELECT COUNT(*) FROM tbl_name對BDB資料表很慢，因為在該資料表中沒有行計數被維持。

· 最佳化器需要知道資料表中的大概行數。MySQL通過計數插入以及在每個BDB資料表中的單獨片斷內維持它來解決了問題。如果您不發出大量的DELETE或ROLLBACK語句，這個數對MySQL最佳化器來說是足夠精確了。可是，MySQL僅在關閉的時候才儲存這個數，所以，如果伺服器被意外地終止，這個數可能是不正確的。即使數不是100%正確，它不是明確的。您可以使用ANALYZE TABLE或者 OPTIMIZE TABLE語句來更新行計數。請參閱13.5.2.1節，「ANALYZE TABLE語法” 和13.5.2.5節，「OPTIMIZE TABLE語法”。

· BDB資料表上的內部鎖定在頁面級別上做。

· LOCK TABLES在BDB資料表上就想在其它資料表上一樣工作。如果您不使用LOCK TABLES，MySQL對該資料表發出一個內部多重寫鎖定（一個不阻止其它作者的鎖定）來確保即使另一個線程發出一個資料表鎖定，該資料表也被恰當地鎖定了。

· 要能夠回滾一個事務，BDB儲存引擎維護日誌檔案。多實現最高性能，您可以使用--bdb-logdir選項來把BDB日誌放在不同的磁盤上，而不是放在資料庫被放置的那個磁盤。

· 每次新BDB日誌檔案被啟動之時，MySQL執行一個檢查點，並且刪掉當前事務不需要的任何BDB日誌檔案。您也可以在任何時候使用FLUSH LOGS來給Berkeley DB資料表設置檢查點。

對災難恢復，您應該使用資料表備份加MySQL的二進制日誌，請參閱5.9.1節，「資料庫備份”。

警告：如果您刪除仍在使用中的舊日誌檔案，BDB根本不能做恢復，並且如果有些事不對，您可能會丟失數據。

· 應用程式必須總是被準備來處理情況，即BDB資料表任何的改變可能導致一個自動回滾並且任何讀可能會帶著一個死鎖錯誤而失敗。

· 如果您在BDB資料表內遇到磁盤滿，您得到一個錯誤（可能是錯誤28），並且事務應該回滾。這與MyISAM資料表相反，對於MyISAM 資料表，mysqld在繼續之前等待足夠的自由磁盤空間。

15.5.5. 修改BDB所需的事宜

· 同時打開許多BDB資料表可能是非常慢的。如果您要使用BDB資料表，您不應使用非常大的資料表緩存（例如，大於256）並且當您使用mysql客戶端之時，您應該使用--no-auto-rehash選項。

· SHOW TABLE STATUS 不為BDB資料表提供一些訊息：

·                mysql> SHOW TABLE STATUS LIKE 'bdbtest'\G

·                *************************** 1. row ***************************

·                           Name: bdbtest

·                         Engine: BerkeleyDB

·                        Version: 10

·                     Row_format: Dynamic

·                           Rows: 154

·                 Avg_row_length: 0

·                    Data_length: 0

·                Max_data_length: 0

·                   Index_length: 0

·                      Data_free: 0

·                 Auto_increment: NULL

·                    Create_time: NULL

·                    Update_time: NULL

·                     Check_time: NULL

·                      Collation: latin1_swedish_ci

·                       Checksum: NULL

·                 Create_options:

·                        Comment:

· 最佳化性能。

· 改變為對資料表掃瞄操作使用無頁面鎖定。

15.5.6. 對BDB資料表的限制

下列資料表說明使用BDB資料表之時您必須要遵從的限制：

· 每個BDB資料表在.db檔案裡儲存檔案被建立之時到該檔案的路徑。這個被做來允許在支援symlinks的多用戶環境裡檢測鎖定。因此，從一個資料庫目錄往另一個目錄移動BDB資料表是不能的。

· 當製作BDB資料表的備份之時，您必須要麼使用mysqldump要麼做一個包含對每個BDB資料表的檔案（.frm和.db檔案）及BDB日誌檔案的備份。BDB儲存引擎在它的日誌檔案儲存未完成的事務以及要求它們在mysqld啟動的時候被呈出來。BDB日誌在數據目錄裡，具有log.XXXXXXXXXX（10位數字）形式名字的檔案。

· 如果允許NULL值的列有唯一的索引，只有單個NULL值是被允許的。這不同於其它儲存引擎。

15.5.7. 使用BDB資料表時可能發生的錯誤

· 如果您升級之後啟動mysqld時發生下列錯誤，它意味著新BDB版本不支援舊日誌檔案格式：

·                bdb:  Ignoring log file: .../log.XXXXXXXXXX:

·                unsupported log version #

在這種情況下，您必須刪除從數據目錄所有BDB日誌（名字為log.XXXXXXXXXX這樣格式的檔案）並重新啟動mysqld。我們也推薦您隨後用mysqldump --opt來轉儲您的BDB資料表，移除資料表，並且從轉儲檔案恢復它們。

· 如果autocommit模式被禁止，您移除在另一個事務中被參考的BDB資料表，您會從您的MySQL錯誤日誌得到如下的錯誤訊息：

·                001119 23:43:56  bdb:  Missing log fileid entry

·                001119 23:43:56  bdb:  txn_abort: Log undo failed for LSN:

·                                       1 3644744: Invalid

這不是一個致命錯誤，但是知道問題被解決，我們推薦您不要移除BDB資料表，除了autocommit模式被允許之時。（修復不是微不足道的）。

15.6. EXAMPLE儲存引擎

EXAMPLE儲存引擎是一個不做任何事情的存根引擎。它的目的是作為MySQL源代碼中的一個例子，用來演示如何開始編寫一個新儲存引擎。同樣，它的主要興趣是對開發者。

要對EXAMPLE引擎檢查源碼，請查看MySQL原始碼分發版的sql/examples目錄。

要允許這個儲存引擎，使用在建立MySQL之時使用--with-example-storage-engine選項來configure。

當您建立一個EXAMPLE之時，伺服器建立在資料庫目錄建立一個資料表定義檔案。檔案由資料表名字開始，並由一個.frm的延伸名。沒有其它檔案被建立。沒有數據被儲存進資料表或者從中取回。

mysql> CREATE TABLE test (i INT) ENGINE = EXAMPLE;

Query OK, 0 rows affected (0.78 sec)

mysql> INSERT INTO test VALUES(1),(2),(3);

ERROR 1031 (HY000): Table storage engine for 'test' doesn't have this option

mysql> SELECT * FROM test;

Empty set (0.31 sec)

EXAMPLE儲存引擎不支援編索引。

15.7. FEDERATED儲存引擎

15.7.1. 安裝FEDERATED儲存引擎

15.7.2. FEDERATED儲存引擎的介紹

15.7.3. 如何使用FEDERATED資料表

15.7.4. FEDERATED儲存引擎的局限性

FEDERATED儲存引擎訪問在遠程資料庫的資料表中的數據，而不是本地的資料表。

FEDERATED儲存引擎僅在－MAX版的MySQL上可用。

要為FEDERATED引擎檢查原始碼，請查看MySQL原始碼分發版的sql目錄。

對於FEDERATED儲存引擎，在http://forums.mysql.com/list.php?105上有一個專門的論壇。

15.7.1. 安裝FEDERATED儲存引擎

要允許這個儲存引擎，當您構建MySQL時請使用--with-federated-storage-engine來configure。

15.7.2. FEDERATED儲存引擎的描述

當您建立一個FEDERATED資料表的時候，伺服器在資料庫目錄建立一個資料表定義檔案。檔案由資料表的名字開始，並有一個.frm延伸名。無其它資料表被建立，因為實際的數據在一個遠程資料庫上。這不同於為本地資料表工作的儲存引擎的方式。

對於本地的數據錄資料表，數據檔案是本地的。例如，如果您建立一個名為user的MyISAM資料表，MyISAM處理器建立一個名為users.MYD的數據檔案。對本地資料表讀，插入，刪除和更新在本地數據檔案裡的數據的處理器和記錄被以對處理器的特定格式儲存。為了讀記錄，處理器必須把數據分解進列。為了寫記錄，列值必須被轉換到被處理器使用的行格式並且被寫進本地的數據檔案。

使用MySQL FEDERATED儲存引擎，沒有對資料表的本地數據檔案（比如，沒有.MYD檔案）。取而代之地，一個遠程資料庫儲存那些正常地應該在資料表中的數據。這使得MySQL客戶端API來讀，刪除，更新和插入數據的使用成為必要。數據取回被通過SELECT * FROM tbl_name SQL語句來初始化。要讀這個結果，通過使用mysql_fetch_row() C API函數，行被一次取一個，然後從SELECT結果包中的列轉換成FEDERATED處理器期望的格式。

基本流程如下：

1. SQL使用被本地發佈

2. MySQL處理器API （數據以處理器格式）

3. MySQL客戶端API （數據被轉換成SQL使用）

4. 遠程資料庫-> MySQL客戶端API

5. 轉換結果包（如果有的話）到處理器格式

6. 處理器 API -> 結果行或受行影響的對本地的計數

15.7.3. 如何使用FEDERATED資料表

使用FEDERATED資料表的步驟是非常簡單的。通常，您運行兩個伺服器，要麼在同一個主機上，要麼在不同主機上。（一個FEDERATED資料表使用其它被同一伺服器管理的資料表也是可能的。雖然只有極少的點要這麼做）。

首先，您必須在您想要用FEDERATED資料表訪問的遠程伺服器上有一個資料表。假設，遠程的資料表在FEDERATED資料庫中並且被如下定義：

CREATE TABLE test_table (

    id     int(20) NOT NULL auto_increment,

    name   varchar(32) NOT NULL default '',

    other  int(20) NOT NULL default '0',

    PRIMARY KEY  (id),

    KEY name (name),

    KEY other_key (other)

ENGINE=MyISAM

DEFAULT CHARSET=latin1;

ENGINE資料表選項可能命名任何儲存引擎，該資料表需要不是一個MyISAM資料表。

接著，在本地伺服器上為訪問遠程資料表建立一個FEDERATED資料表：

CREATE TABLE federated_table (

    id     int(20) NOT NULL auto_increment,

    name   varchar(32) NOT NULL default '',

    other  int(20) NOT NULL default '0',

    PRIMARY KEY  (id),

    KEY name (name),

    KEY other_key (other)

ENGINE=FEDERATED

DEFAULT CHARSET=latin1

CONNECTION='mysql://root@remote_host:9306/federated/test_table';

（注意: CONNECTION 替代用在先前版本的MySQL裡的COMMENT）。

除了ENGINE資料表選項應該是FEDERATED，並且CONNECTION資料表選項是給FEDERATED指明如何連接到遠程伺服器上的連接字串之外，這個資料表的結構必須完全與遠程資料表的結構相同。

FEDERATED引擎僅建立在已聯盟資料庫中的test_table.frm檔案。

遠程主機訊息指明本地伺服器要連接到的遠程伺服器，資料庫和資料表訊息指明哪一個遠程資料表要被作為數據檔案來用。在這個例子中。遠程伺服器被指定來作為遠程主機在9306端口上運行，所以您要啟動伺服器，讓它監聽9306端口。

在CONNECTION選項中的連接字串的一般形式如下：

scheme://user_name[:password]@host_name[:port_num]/db_name/tbl_name

只有mysql在這一點被支援為scheme，密碼和端口號時可選的。

這裡有一些連接字串的例子：

CONNECTION='mysql://username:password@hostname:port/database/tablename'

CONNECTION='mysql://username@hostname/database/tablename'

CONNECTION='mysql://username:password@hostname/database/tablename'

為指定連接字串使用CONNECTION是非可選，並且在將來可能會改變。當您使用FEDERATED資料表的時候，要記得這個，因為這意味著當將來發生那種改變之時，可能被要求。

因為任何被用的密碼作為純文本被存在連接字串中，它可以被任何使對FEDERATED資料表使用SHOW CREATE TABLE或SHOW TABLE STATUS的用戶，或者在INFORMATION_SCHEMA資料庫中查詢TABLES資料表的用戶看見。

對於FEDERATED儲存引擎，在http://forums.mysql.com/list.php?105上有一個專門的論壇。

15.7.4. FEDERATED儲存引擎的局限性

FEDERATED支援及不支援的如下：

· 在第一個版本中，遠程伺服器必須是一個MySQL伺服器。FEDERATED對其它資料庫引擎的支援可能會在將來被新增。

· FEDERATED資料表指向的遠程資料表在您通過FEDERATED資料表訪問它之前必須存在。

· 一個FEDERATED資料表指向另一個FEDERATED資料表是可能的，但是您必須小心不要建立一個循環。

· 沒有對事務的支援。

· 如果遠程資料表已經改變，對FEDERATED引擎而言是沒有辦法知道的。這個的原因是因為這個資料表必須象數據檔案一樣工作，除了資料庫其它任何都不會被寫入。如果有任何對遠程資料庫的改變，本地資料表中數據的完整性可能會被破壞。

· FEDERATED儲存引擎支援SELECT, INSERT, UPDATE, DELETE和索引。它不支援ALTER TABLE, DROP TABLE或任何其它的數據定義語言語句。當前的實現不使用預先準備好的語句。

· 執行使用SELECT, INSERT, UPDATE和DELETE，但不用HANDLER。

· FEDERATED資料表不能對查詢緩存不起作用。

這些限制中的一些在FEDERATED處理機的將來版本可能被消除。

15.8. ARCHIVE儲存引擎

ARCHIVE儲存引擎被用來以非常小的覆蓋區儲存大量無索引數據。

要允許這個儲存引擎，在建立MySQL之時使用--with-archive-storage-engine選項來configure。如果這個儲存引擎可帶這個語句使用，您可以看見：

mysql> SHOW VARIABLES LIKE 'have_archive';

當年建立一個ARCHIVE資料表，伺服器在資料庫目錄建立一個資料表定義檔案。檔案由資料表的名字開始，並由一個.frm的延伸名。儲存引擎建立其它檔案，所有都有由資料表名字開頭的名字。數據和元數據檔案有延伸名.ARZ和.ARM。一個.ARN檔案可能在最佳化操作中出現。

ARCHIVE引擎僅支援INSERT和SELEC（無刪除，替換或更新）。它支援ORDER BY操作，BLOB 域，以及基本地所有數據類型，除了幾何數據類型（請參閱19.4.1節，「MySQL 空間數據類型”）。ARCHIVE引擎使用行級鎖定。

儲存: 當記錄被插入時，它們被壓縮。ARCHIVE引擎使用zlib無損數據壓縮。OPTIMIZE TABLE的使用可以分析資料表，並把它打包為更小的格式（使用OPTIMIZE TABLE的原因，往下看）。引擎頁支援CHECK TABLE。有數種被使用的插入類型：

· 直接插入INSERT之時把一行推僅壓縮緩衝，並且緩衝在它需要的時候刷新。到緩衝的插入被鎖定保護。一個SELECT強制一個刷新發生，除非進來的唯一插入是INSERT DELAYED（那些刷新如同需要一樣）。請參閱13.2.4.2節，「INSERT DELAYED 語法”。

· 塊插入旨在它完成後可見，除非其它插入在同一時間發生，在這種情況下，塊插入可以被部分看見。一個SELECT不會導致一個塊插入的刷新，除非SELECT在被裝載時發生一個正常插入。

取回： 在取回時，記錄根據需要被解壓縮，沒有行緩存。一個SELECT操作執行完全資料表格掃瞄：當一個SELECT發生之時，它找出當前有多少行可用，並讀行的數量。SELECT被當作持續讀來執行。注意，許多SELECT語句在插入過程中會損壞壓縮，除非塊插入或者延遲的插入被使用。要修復任何已發生壓縮問題，您可以總是做OPTIMIZE TABLE（也支援REPAIR TABLE）。被SHOW TABLE STATUS報告的行數總是正確的。請參閱13.5.2.6節，「REPAIR TABLE語法”，13.5.2.5節，「OPTIMIZE TABLE語法”，13.5.4.18節，“SHOW TABLE STATUS 語法”。

對於ARCHIVE儲存引擎，在 http://forums.mysql.com/list.php?112 上有專門論壇。

15.9. CSV儲存引擎

CSV儲存引擎使用逗號分隔值格式的文本檔案儲存數據。

要允許使用這個儲存引擎，當您建立MySQL之時，使用--with-csv-storage-engine選項來configure。

當您建立一個CSV資料表之時，伺服器在資料庫目錄建立一個資料表定義檔案。檔案由資料表的名字開始，並且由一個.frm的延伸名。儲存引擎也建立一個數據檔案。它的名字由資料表的名字開始，並且有一個.CSV的延伸名。數據檔案是無格式文本檔案。當您把數據儲存進資料表時，儲存引擎用CSV格式把它存進數據檔案。

mysql> CREATE TABLE test(i INT, c CHAR(10)) ENGINE = CSV;

Query OK, 0 rows affected (0.12 sec)

mysql> INSERT INTO test VALUES(1,'record one'),(2,'record two');

Query OK, 2 rows affected (0.00 sec)

Records: 2  Duplicates: 0  Warnings: 0

mysql> SELECT * FROM test;

+------+------------+

| i    | c          |

+------+------------+

|    1 | record one |

|    2 | record two |

+------+------------+

2 rows in set (0.00 sec)

如果您檢查在執行前述語句所建立的資料庫目錄裡的test.CSV檔案，它的內容應該看起來像如下所示：

"1","record one"

"2","record two"

CSV儲存引擎不支援索引。

15.10. BLACKHOLE儲存引擎

BLACKHOLE儲存引擎就像“黑洞”一樣，它接收數據但丟棄它而不是儲存它。取回總是返回空集：

mysql> CREATE TABLE test(i INT, c CHAR(10)) ENGINE = BLACKHOLE;

Query OK, 0 rows affected (0.03 sec)

mysql> INSERT INTO test VALUES(1,'record one'),(2,'record two');

Query OK, 2 rows affected (0.00 sec)

Records: 2  Duplicates: 0  Warnings: 0

mysql> SELECT * FROM test;

Empty set (0.00 sec)

當您建立一個BLACKHOLE資料表的時候，伺服器在資料庫目錄建立一個資料表定義檔案。檔案用資料表的名字開頭，並且有一個.frm延伸名。沒有其它檔案關聯到這個資料表格。

BLACKHOLE儲存引擎支援所有種類的索引。

要允許這個儲存引擎，在您建立MySQL之時使用--with-blackhole-storage-engine選項來configure。BLACKHOLE儲存引擎在MySQ供應的伺服器二進製版裡可以找到；通過查看SHOW ENGINES或SHOW VARIABLES LIKE 'have%'的輸出，您可以確定您的版本是否支援這個引擎。

到BLACKHOLE資料表的插入不儲存任何數據，但如果二進制日誌被允許，SQL語句被寫入日誌（並被複製到從伺服器）。這可以有用幫助地作為重複器或過濾器機制。例如，假設您的應用需要從伺服器側的過濾規則，但傳輸所有二進制日誌數據到從伺服器首先導致過多交通的結果。在這種情況下，在主伺服器主機上建立一個偽從伺服器程序，它的儲存引擎是BLACKHOLE，描述如下：

主伺服器寫它的二進制日誌。偽mysqld程序作為從伺服器，應用期望的replicate-do和replicate-ignore規則的合併，並且寫一個新的，被過濾的屬於它自己的二進制日誌。（請參閱6.8節，「複製啟動選項”）。這個已過濾日誌被提供給從伺服器。

既然偽程序不確實地儲存任何數據，只有很小的由在複製主伺服器主機上額外的mysqld程序招致的處理開支。這個類型的建立可以用額外複製從伺服器來重複。

其它可能對BLACKHOLE儲存引擎的使用包括：

· 轉儲檔案語法的驗證。

· 來自二進制日誌記錄的開銷測量，通過比較允許二進制日誌功能的BLACKHOLE的性能與禁止二進制日誌功能的BLACKHOLE的性能。

· 因為BLACKHOLE本質上是一個“no-op” 儲存引擎，它可能被用來搜尋與儲存引擎自身不相關的性能瓶頸。

這是MySQL參考手冊的翻譯版本，關於MySQL參考手冊，請訪問dev.mysql.com。原始參考手冊為英文版，與英文版參考手冊相比，本翻譯版可能不是最新的。

第15章：儲存引擎和資料表類型

15.1. MyISAM儲存引擎

15.1.1. MyISAM啟動選項

15.1.2.鍵所需的空間

15.1.3. MyISAM資料表的儲存格式

15.1.3.1. 靜態（固定長度）資料表特徵

15.1.3.2. 動態資料表特徵

15.1.3.3. 已壓縮資料表特徵

15.1.4. MyISAM資料表 方面的問題

15.1.4.1. 損壞的MyISAM資料表

15.1.4.2. 未被適當關閉的資料表的問題

15.2. InnoDB儲存引擎

15.2.1. InnoDB概述

15.2.2. InnoDB聯繫訊息

15.2.3. InnoDB配置

15.2.4. InnoDB啟動選項

15.2.5. 建立InnoDB資料表空間

15.2.5.1. 處理InnoDB初始化問題

15.2.6. 建立InnoDB資料表

15.2.6.1. 如何在InnoDB中用不同的API來使用事務

15.2.6.2. 轉換MyISAM資料表到InnoDB

15.2.6.3. AUTO_INCREMENT列在InnoDB裡如何工作

15.2.6.4.外部鍵約束

15.2.6.5. InnoDB和MySQL複製

15.2.6.6. 使用Per-Table資料表空間

15.2.7. 新增和刪除InnoDB數據和日誌檔案

15.2.8. 備份和恢復InnoDB資料庫

15.2.8.1. 強制恢復

15.2.8.2. 檢查點

15.2.9. 把一個InnoDB資料庫移到另一台機器

15.2.10. InnoDB事務模型和鎖定

15.2.10.1. InnoDB鎖定模式

15.2.10.2. InnoDB和 AUTOCOMMIT

15.2.10.3. InnoDB和TRANSACTION ISOLATION LEVEL

15.2.10.4. 持續非鎖定讀

15.2.10.5. 鎖定讀SELECT ... FOR UPDATE和SELECT ... LOCK IN SHARE MODE

15.2.10.6. Next-Key鎖定：避免幽靈問題

15.2.10.7. 持續讀如何在InnoDB中工作的例子

15.2.10.8. 在InnoDB中不同SQL語句設置的鎖定

15.2.10.9. MySQL何時 隱式提交或回滾一個事務？

15.2.10.10. 死鎖檢測和回滾

15.2.10.11. 如何處理死鎖

15.2.11. InnoDB性能調節提示

15.2.11.1. SHOW INNODB STATUS和 InnoDB Monitors

15.2.12. 多版本的實施

15.2.13. 資料表和索引結構

15.2.13.1. 索引的物理結構

15.2.13.2. 緩衝插入

15.2.13.3. 適應的哈希索引

15.2.13.4. 物理記錄結構

15.2.14.檔案空間管理和磁盤I/O

15.2.14.1. 磁盤 I/O

15.2.14.2. 為資料表空間使用原始設備

15.2.14.3.檔案空間管理

15.2.14.4. 整理資料表碎片

15.2.15. InnoDB錯誤處理

15.2.15.1. InnoDB錯誤代碼

15.2.15.2. 作業系統錯誤代碼

15.2.16. 對InnoDB資料表的限制

15.2.17. InnoDB故障診斷和排除

15.2.17.1. InnoDB數據詞典操作錯誤診斷和排除

15.3. MERGE儲存引擎

15.3.1. MERGE資料表 方面的問題

15.4. MEMORY (HEAP)儲存引擎

15.5. BDB (BerkeleyDB)儲存引擎

15.5.1. BDB支援的作業系統

15.5.2. 安裝BDB

15.5.3. BDB啟動選項

15.5.4. BDB資料表的特徵

15.5.5. 修改BDB所需的 事宜

15.5.6. 對BDB資料表的限制

15.5.7. 使用BDB資料表時可能發生的錯誤

15.6. EXAMPLE儲存引擎

15.7. FEDERATED儲存引擎

15.7.1. 安裝FEDERATED儲存引擎

15.7.2. FEDERATED儲存引擎的描述

15.7.3. 如何使用FEDERATED資料表

15.7.4. FEDERATED儲存引擎的局限 性

15.8. ARCHIVE儲存引擎

15.9. CSV儲存引擎

15.1.4. MyISAM資料表方面的問題

15.2.10.9. MySQL何時隱式提交或回滾一個事務？

15.3.1. MERGE資料表方面的問題

15.5.5. 修改BDB所需的事宜

15.7.4. FEDERATED儲存引擎的局限性