## 常见的优化有以下几个方面：
* SQL及索引
* 数据库表结构
* 系统配置
* 硬件
<br/>
上面这些越来越成本高，但是优化效果越来越差。

# 一、SQL及索引的优化

### 如何发现有问题的SQL？
使用MYSQL慢查询日志对有效率问题的SQL进行监控：
* `show variables like 'slow_query_log'`
* `set global slow_query_log_file='/home/mysql/sql_log/mysql-slow.log'`这个是指定了慢查询的日志的位置在哪里。
* `set global log_queries_not_using_indexs=on;`指定是否把没有使用索引的SQL记录到慢查询日志中，通常是需要的。
* `set global long_query_time=1`指定把大于多少秒的SQL记录到慢查询日志中。

#### 慢查询日志包含的内容
* 执行SQL的主机信息:# User@Host:root[root]@localhost[]
* SQL的执行信息: # Query_time:0.00024 Lock_time:0.000000 Rows_sent:0 Rows_examined:0
* SQL执行时间: SET timestamp=1408275856;
* SQL的内容: select CONCAT();

#### 慢查日志的分析工具
* mysqldumpslow(MySQL官方的，会随着MySQL自动安装到我们的服务器中， -h来显示说明)
* pt-query-digest(慢查日志的分析工具)
    * 输出到文件: pt-query-digest slow.log > slow_log.report
    * 输出到数据库表: pt-query-digest slow.log -review h=127.0.0.1,D=test,p=root,P=3306,u=root,t=query_review --create-reviewtable --review-hostory t=hostname_slow。其中的`review`参数是把结果放单数据库的一个表里。通过`create-reviewtable`来建立相关的存储表。
    * 输出的内容包含了三个部分：
        1. 头信息，显示出了日志的时间范围，以及总的SQL数量和不同的SQL数量。
        2. `ResponseTime`:响应时间占比，`Calls`:sql执行次数。
        3. 具体的SQL是什么。

#### 如何通过慢查日志发现有问题的SQL。
1. **查询次数多且每次查询占用时间长的SQL。**通常为pt-query-digest分析的前几个查询。
2. **IO大的SQL。**注意pt-query-digest分析中的`Rows examine`项。
3. **未命中索引的SQL。**注意pt-query-digest分析中`Rows examine`(表示扫描的行数)和`Rows Send`(表示发送的行数)的对比。

#### 通过explain查询和分析SQL的执行计划
通过explain `[我们自己的SQL]`来看执行的计划。
`explain`返回各列的含义：
* `table`:显示这一行的数据是关于哪张表的；
* `type`:这是重要的列，显示连接使用了何种类型。**从最好到最差的连接类型为`const`(表示是长度查找，一般是主键查找)、`eq_reg`(范围查找，一般是唯一索引和主键的 范围查找)、`ref`(常见于连接的查询中，基于某一个索引查找)、`range`(基于索引的范围查找)、`index`(通常是对于索引的扫描)和`ALL`(实际上是进行表扫描)。**
* `possible_keys`:显示可能应用在这张表中的索引。如果为空，没有可能的索引。
* `key`: 实际使用的索引。若果为`NULL`，则没有使用索引。
* `key_len`: 使用的索引的长度。在不损失精确性的情况下，长度越短越好。
* `ref`: 显示索引的哪一列被使用了，如果可能的话，是一个常数。
* `rows`: MySQL认为必须检查的用来返回请求数据的行数。
* `extra`：列需要注意的返回值：
    * `Using filesort`：看到这个的时候，查询就需要优化了。MYSQL需要进行额外的步骤来发现如何对返回的行排序。它根据连接类型以及存储排序键值和匹配条件的全部行的指针来排序全部行。
    * `Using temporary`：看到这个的时候，查询需要优化了。这里，MYSQL需要创建一个临时表来存储结果，这通常发生在对不同的列集进行`ORDER BY`上，而不是`GROUP BY`上。

#### `Count()`和`Max()`的优化
* `Max`可以通过建立索引（`create index idx_paydate[索引的名称] on payment[表名](payment_date[列名]);`来优化。 **需要注意的是索引是顺序排序的！**）完全能够通过索引能查到我们需要的结果，这种索引叫做`覆盖索引`。
* `Count`函数中，实际上也可以加判断条件，如:Count(release_year=2006 Or null)。`需要注意的是Count(*)是包括空值的，而Count(id)是不包含空值的`。

#### 子查询的优化
* 通常情况下，需要把子查询优化为join查询，但在优化时要注意**关联键是否有一对多的关系，要注意重复数据(需要用到`distinct`)**。

#### group by的优化
* 如果有查询条件的话，尽量在子查询中进行，这样不会生成临时表。

#### Limit查询的优化
* limit常用于分页处理，时常会伴随`order by`从句使用，因此大多时候会使用`Filesorts`，这样会造成大量的IO问题。
* 优化步骤1：使用`有索引的列`或`主键`进行`Order by`操作。
* 优化步骤2：记录上次返回的主键，在下次查询时使用主键过滤。(避免了数据量大时扫描过多的记录。**这种方式要求主键是顺序排列的，是顺序增长的。对于不连续的，我们需要建立附加的列。**)

# 二、索引优化

#### 如何选择合适的列建立索引？
1. 在`where`从句，`group by`从句，`order by`从句，`on`从句中出现的列(这种情况的索引叫做覆盖索引)；
2. 索引字段越小越好；
3. 离散度大的列放到联合索引的前面(**通过Count查询唯一值，唯一值越多，离散度越好**)。

#### 索引优化SQL的方法
**索引能增查询的速度，但是会降低写入的速度。**<br/>
1. 索引的维护及优化——重复及冗余索引：`重复索引`是指相同的列以相同的顺序建立的同类型的索引(例如给主键增加unique)。`冗余索引`是指多个索引的前缀列相同，或是在联合索引中包含了主键的索引。
2. 索引的维护及优化——查找重复及冗余索引：(1)要用到`information_schema`来进行查看。(2)使用`pt-duplicate-key-checker`工具检查重复及冗余索引。(**pt-duplicate-key-checker -uroot[用户] -p '123456'[密码] -h 127.0.0.1[服务器端口]**)
3. 索引的维护及优化——删除不用索引：目前MySQL中还没有记录索引的使用情况，但是在`PerconMySQL`和`MariaDB`中可以通过`INDEX_STATISTICS`表来查看哪些索引未使用，但在MySQL中目前只能通过慢查询日志配合`pt-index-usage`工具来进行索引使用情况的分析。(`pt-index-usage -uroot -p'1234' mysql-slow.log`)

# 三、数据库结构优化

### 选择合适的数据类型
数据类型的选择，重点在于**合适**二字，如何确定选择的数据类型是否合适？
1. 使用可以存下你的数据的最小的数据类型。(使用int来存储日期时间，利用`FROM_UNIXTIME()【进行转换】,UNIX_TIMESTAMP()【存的时候用】两个函数来进行转换。`；使用`bigint`来IP地址，利用`INET_ATON()【IP转换成bigint】,INET_NTOA()【bigint转换成IP】`两个函数来进行转换。**这些更省空间，更加高效。**)
2. 使用简单的数据类型。Int要比VARChAR类型在mysql处理上简单。
3. 尽可能的使用`not null`定义字段。(非not null会需要特殊的字段金习性存储，并且增加IO的操作。)
4. 尽量少用`text`类型，费用不可时最好考虑分表。

### 表的范式化优化
