1.整型

约 1693 字大约 6 分钟

2025-05-27

数值类型	字节	描述
`TINYINT[UNSIGNED]`	1	很小的整数，默认有符号 `[-128,127]/[0,255]`
`SMALLINT[UNSIGNED]`	2	较小的整数，默认有符号 `[-32768,32767]/[0,65535]`
`MEDIUMINT[UNSIGNED]`	3	中等的整数，默认有符号 `[-8388608,8388607]/[0,16777215]`
`INT[UNSIGNED]`/`INTEGER[UNSIGNED]`	4	标准的整数，默认有符号 `[-2147483648,2147483647]/[0,4294967295]`
`BIGINT[UNSIGNED]`	8	较大的整数，默认有符号 `[-9223372036854775808,9223372036854775807]/[0,18446744073709551615]`

如果插入了超出对应字段合法范围的数据，MySQL 就会拒绝插入的行为，因此在 MySQL 看来，所有能插入的数据都是合法的，因此数据类型实际上就是一种约束（我们以后再来好好理解这个词，现在先简单了解一下），倒逼程序员进行正确的操作，保证数据插入的合法性。

2.二进制类型

二进制类型	描述
`BIT(M)`	位类型，`M` 为指定位数，默认值为 `1`，范围为 `[1-64]`
`TINYBLOB`	很小的二进制数据
`BLOB`	二进制大对象
`MEDIUMBLOB`	中等大小的二进制数据
`LONGBLOB`	较大的二进制数据

MySQL 通常按照 ASCII 码值显示的，因此无法直接显示位类型的 0/1 ，我们可以使用十进制来查看（例如 select hex(bit_data) from table_name;）。

而因此插入的一些二进制值达到 ASCII 的合法范围时，就会显示出对应的 ASCII 字符。

3.小数类型

小数类型	字节	描述
`FLOAT[(M,D)][UNSIGNED]`	4	单精度浮点数，默认有符号，`M` 为显示长度，`D` 为小数位数/精度
`DOUBLE[(M,D)][UNSIGNED]`		双精度浮点数，默认有符号
`DECIMAL(M,D)[UNSIGNED]`		定点数，适用于存储精确的小数，默认有符号

浮点类型如果规定了小数点的位数，则显示的长度里包含小数点规定的位数（但是不包含小数点），例如插入 10.0 会显示 10.00，插入 100.1 会插入失败（实际插入的是 100.10）。

但是如果插入多余的小数位，会发生四舍五入的存储，例如插入 10.016，实际插入的值是 10.02。

因此也无法插入 99.996，但是允许插入 99.9900001。

一般浮点数的数值很大，一般不会关心一个浮点数的大小，用户只需要根据自己的需求设置显示位数和精度即可。

浮点类型可能存在较大的数据缺失问题，而定点数类型则可以尽可能规避这个问题（如果希望精度更高就需要使用 decimal 类型）。

4.文本类型

文本类型	描述
`CHAR(L)`	定长字符串，`L` 为存储长度，最大值为 `255`，单位是一个“字符”
`VARCHAR(L)`	变长字符串，`L` 的最大值为 `65535` 个“字节”，但是其中有 `1~3` 个字节需要记录数据大小，因此有效字节数为 `65532`。在 `utf8` 中也就是最多 `65532/3=21844` 个字符（`*3`），在 `gbk` 中也就是 `65532/2=32766`（也就是说，具体字符个数和所用编码密切相关）。
`BINARY`	定长二进制字符串
`VARBINARY`	变长二进制字符串
`TINYTEXT`	很小的文本数据
`TEXT`	普通的文本数据
`MEDIUMTEXT`	中等的文本数据
`LONGTEXT`	较大的文本数据

不定长的字符串可以会影响查询效率，但是空间利用率较高。在使用 varchar 类型是，上限就是 L，是“有多少用多少，不超过 L”，而定长的字符串是“就算只有这么多，也会占用 L”，两者的区别类似 C/C++ 的 char s[size] 和 std::string str 的区别。

另外需要注意一个汉字字符也是一个字符，这点很特殊，即使一个中文汉字用多个字节表示，也依旧可以使用 char(1) 来表示（但是需要注意有时候会报字符集不匹配的错误）。

疑惑：关于 VARCHAR(L) 中的 L 是字符个数还是字节个数，貌似不同版本的 MySQL 是不一样的。

5.时间类型

时间类型	字节	描述
`DATE`	3	日期值，格式为 `yyyy-mm-dd`，对于时间精度只需要到天数时就使用该类型，需要程序员自己登记修改
`DATETIME`	8	日期和时间值，格式为 `yyyy-mm-dd HH:ii:ss`，需要程序员自己登记修改
`TIMESTAMP`	4	时间戳，格式和 `DATETIME` 一样，该字段会自动填入（若使用 `UPDATE table_name set field_name='new_value'` 更新同一项的其他字段数据时，将会自动更新），因此时间戳经常被用于数据被更新的最近时间点，无需程序员自己登记修改
`TIME`		时间
`YEAR`		年份

6.复合类型

复合类型描述

ENUM 枚举（单选）。只是设定若干选项，最终在单元格中只存储了一个实际值，枚举值的大小范围为 [1,65535]，使用方法和 C/C++ 的枚举体类似，枚举字段的数据只允许填入之前枚举出的所有值。并且，如果插入的数字是合法范围的值，也会转为为对应的枚举标识（如果忽略该字段会自动填入 NULL，使用 0 作为插入会导致非法操作）

SET 集合（多选）。和枚举不同，一个列可以拥有多个值，多个值作为一个字段数据插入的时候，整体看作一个字符串即可。并且我们还可以使用数字来插入数据，该数字为 0001 代表四个元素中的第一个元素，若为 0101 则代表四个元素中的第一、第三个元素（如果忽略该字段会自动填入 NULL，使用 0 作为插入会导致为空）

复合类型	描述
`ENUM`	枚举（单选）。只是设定若干选项，最终在单元格中只存储了一个实际值，枚举值的大小范围为 `[1,65535]`，使用方法和 `C/C++` 的枚举体类似，枚举字段的数据只允许填入之前枚举出的所有值。并且，如果插入的数字是合法范围的值，也会转为为对应的枚举标识（如果忽略该字段会自动填入 `NULL`，使用 `0` 作为插入会导致非法操作）
`SET`	集合（多选）。和枚举不同，一个列可以拥有多个值，多个值作为一个字段数据插入的时候，整体看作一个字符串即可。并且我们还可以使用数字来插入数据，该数字为 `0001` 代表四个元素中的第一个元素，若为 `0101` 则代表四个元素中的第一、第三个元素（如果忽略该字段会自动填入 `NULL`，使用 `0` 作为插入会导致为空）

使用 FIND_IN_SET(SUB, STR_LIST) 可以来查找集合中是否有某“一个”元素，若 sub 这个单一元素在 str_list(不要在逗号后面加空格) 集合中则返回其下标，若不存在则返回 0。

而如果我们直接使用 where field_name='new_value' 子句来查询集合时，采用的是严格匹配法，我们需要不严格匹配时，就需要使用上述 find_in_set() 的接口。

也就是使用 SELECT * FROM table_name WHERE FIND_IN_SET(sub, STR_LIST) 来查询，这样只要有一个元素存在于集合字段中，就可以被查询出来。

而如果希望包含多个元素，就需要使用 AND 来级联多个接口，也就是使用 SELECT * FROM table_name WHERE FIND_IN_SET(sub_1, STR_LIST) AND FIND_IN_SET(sub_2, STR_LIST) AND ...

补充：NULL 和 (空) 是两种东西。

7.布尔类型

布尔类型	描述
`BOOL`	使用 `0/1` 表示“真/假”

使用起来较简单，略，待补充...

版权所有

版权归属：limou3434

许可证：署名 4.0 国际 (CC-BY-4.0)