如何最快地实现 ALTER TABLE

如果您不了解ALTER TABLE的语法,可以先参考:

http://dev.mysql.com/doc/refman/5.1/en/alter-table.html

使用ALTER TABLE 可以修改一张表的结构。比如,添加或者删除一个字段,创建或者删除一个索引,修改一个字段的类型,或者重命名一个字段,或者表的一些元信息。我们还可以通过ALTER TABLE来修改表引擎。

在大多数情况下,ALTER TABLE通过建立一个原表的拷贝,并在拷贝上修改,然后删除原表,最后修改拷贝的名称为原表名来实现。在执行ALTER TABLE的时候是不能更新(update or insert)数据的, 但是其他的session是可以read的。

下面来具体看看如何最快的执行ALTER TABLE(这儿不考虑 分区/MySQL Cluster/表空间)

在某些特定的情况下,ALTER TABLE 是不需要建立临时拷贝的,所以是很快的。

1. 重命名一个字段或者索引

2. 修改一个字段的默认值

3. 添加新的枚举值到enum的末尾 或者 添加新的set值到set的末尾

4. 仅仅重命名表,而不修改其余任何参数

其他的情况,MySQL会建立一个临时表来执行ALTER TABLE。

对于MyISAM表,增大如下的变量可以加快ALTER TABLE的执行过程。

1. myisam_sort_buffer_size MySQL会在REPAIR TABLE索引排序或者使用ALTER TABLE/CREATE INDEX创建索引的时候申请缓冲的大小。

2. myisam_max_sort_file_size MySQL在使用REPAIR TABLE/ALTER TABLE/LOAD DATA重建MyISAM索引的时候允许申请的最大临时文件的大小,如果超过这个大小,MySQL将会使用很慢的key cache。

对于MyISAM表,还可以通过批量的建立索引来加快整个ALTER TABLE执行过程。通过在ALTER TABLE之前 运行 ALTER TABLE ... DISABLE KEYS/在ALTER TABLE之后运行ALTER TABLE ... ENABLE KEY来激活这个特性。但是个该特性对于主键和唯一索引不起作用。

在数据量比较大的时候,采用dump data/drop table/recreate table/load data的方式来修改表结构,会比ALTER TABLE快很多,当然这要看具体的应用,因为ALTER TABLE的过程中,可以提供继续read, 而采用dump data的方式则不行。

根据

http://everythingmysql.ning.com/profiles/blogs/whats-faster-than-alter

上的测试结果,80W条记录,约5G的数据量,采用dump data可以比ALTER TABLE直接修改快47%.

 

采用dump data的方式基本步骤如下:

 

1. 使用 select * from tablename into outfile "/tmp/data"; 保存数据到临时文件 /tmp/data

2. drop table tablename;

3. create table tablename (...);

4. 如果是 MyISAM, alter table tablename disable keys;

5. load data infile "/tmp/data" into tablename;

6. 如果是 MyISAM, alter tabe tablename enable keys;

最后,需要特别说明一下,有些时候,不一定需要最快,但应该选择最适合、最可靠的方式。

 

参考:

1. http://venublog.com/2010/01/04/performance-comparison-of-repair-by-sorting-or-by-keycache/

2. http://dev.mysql.com/doc/refman/5.1/en/alter-table.html

3. http://dev.mysql.com/doc/refman/5.1/en/server-system-variables.html

4. http://everythingmysql.ning.com/xn/detail/3993569%3ABlogPost%3A171

This article is posted by on , link is .

Leave a reply