慎重选择数据类型很重要、为啥哩?可以提高性能、原理如下:
● 存储(内存、磁盘)、从而节省I/O(检索相同数据情况下)
● 计算、进而减负CPU负载
数据类型总体可分三种:数字、字符和时期
㈠ 数字
① 分类
② 为整数类型指定宽度没啥意义、硬说呢、大概也是为了显示字符的个数、人性化点
因为、对于存储和计算而言、INT(1)和INT(100)是相同的
③ 对于浮点、建议只指定数据类型、而不要指定精度
④ 对于定点、尽量只在对小数精确计算时才使用、如存储财务数据
但天朝某些财务软件在其数据库内使用float作为工资类型
赤裸裸的资本家的丑恶展现、鄙视!!!
⑤ 在数据量较大时、建议把实数类型转为整数类型
原因很简单:
● 浮点不精确
● 定点计算代价昂贵
例如:
要存放财务数据精确到万分之一、则可以把所有金额乘以一百万、然后存在BIGINT下
㈡ 字符串
① 分类
② 数据如何存储取决于存储引擎
char和varchar在不同引擎在内存和磁盘可能是不一样的
不过、对于char、在填充和截取上是一样的、因为、
这部分是在Server层完成的
③ 常见 char 使用场景
● 很短的字符串或所有值都接近同一个长度、如存储密码的MD5值
● 经常变更的列、因为char产生的碎片少
● 非常短的列、如性别、char(1)的效率更好、毕竟varchar(1)浪费了1一个字节
④ 和字符集的那点猫腻
CSDN 有个讨论非常热的帖子:有人认为unicode跟utf-8是等同的吗?点击看讨论贴
我赶脚、这其实没啥好讨论的、因为、这两个根本就是两回事
Unicode 是字符编码
utf8 是字符集
对Unicode编码的字符集、墙裂建议使用varchar
显然、utf8 也是Unicode 编码的、而且、随着国际化趋势、utf8 是首选
那么、结果是、在char 和 varchar 竞争里、varchar 便是最大赢家
可通过下列方法查看MySQL Unicode支持的字符集以及当前的字符集
mysql> select CHARACTER_SET_NAME from character_sets
-> where DESCRIPTION like '%Unicode%'\G;
*************************** 1. row ***************************
CHARACTER_SET_NAME: utf8
*************************** 2. row ***************************
CHARACTER_SET_NAME: ucs2
*************************** 3. row ***************************
CHARACTER_SET_NAME: utf8mb4
*************************** 4. row ***************************
CHARACTER_SET_NAME: utf16
*************************** 5. row ***************************
CHARACTER_SET_NAME: utf32
5 rows in set (0.06 sec)
mysql> status;
--------------
mysql Ver 14.14 Distrib 5.5.16, for Linux (i686) using EditLine wrapper
Connection id: 1
Current database: information_schema
Current user: root@localhost
SSL: Not in use
Current pager: stdout
Using outfile: ''
Using delimiter: ;
Server version: 5.5.16-log Source distribution
Protocol version: 10
Connection: Localhost via UNIX socket
Server characterset: latin1
Db characterset: utf8
Client characterset: utf8
Conn. characterset: utf8
UNIX socket: /tmp/mysql.sock
Uptime: 2 min 9 sec
⑤ 对于InnoDB 建议使用varchar
现在很多场合都使用了InnoDB、算下来、varchar 又赢了
⑥ 存储大数据
● BLOB:采用二进制存储、没有字符集或排序规则
● TEXT:采用字符方式存储、有字符集和排序规则
最好尽量避免使用这两、如果可以、可以把BLOB货TEXT 列分离成单独的表
对于使用了BLOB或TEXT大量删除或更新时、
建议定期使用 optimize table 碎片整理
㈢ 日期和时间类型
常见的有 datatime、timestamp 和 date
从存储上看、timestamp 占 4 个字节、其他两个 8 个字节
所以、若无意外、最好尽量使用 timestamp 、即使它比较调皮、例如和时区相关
By David Lin
2013-06-02
Good Luck
分享到:
相关推荐
优化器(主要对执行的 SQL 优化选择最优的执行方案方法) 执行器(执行时会先看用户是否有执行权限,有才去使用这个引擎提供的接口)-> 去引擎层获取数据返回(如果开启查询缓存则会缓存查询结果) 索引相关 3、...
字段及数据类型: ID 文本 列车车次 Type 文本 列车类型(普快,空调快速,动车…) S_No 数字 站序 Station 文本 车站 Day 数字 日期(当天,第2天,第3天) A_Time 时间 到达时间 D_Time 时间 离开时间 ...
优化器(主要对执行的 SQL 优化选择最优的执行方案方法) 执行器(执行时会先看用户是否有执行权限,有才去使用这个引擎提供的接口)-> 去引擎层获取数据返回(如果开启查询缓存则会缓存查询结果) 索引相关 3、...
在二手房信息管理工作中有大量的数据要处理,对数据库的设计要求做到:数据尽可能不重复,以最优方式为某个特定组织的多种应用服务。因此,对应二手房信息管理的需求以及系统功能的划分为本系统的数据库设计了七个...
11.1.4 数据类型 11.1.5 操作符和函数 11.1.6 交互式和非交互式的Pig 11.2 使用Pig 在日志数据中发现恶意行为者 11.2.1 加载数据 技术点67 加载Apache 日志文件 11.2.2 过滤和投影 技术点68 ...
10.2.1 序列化和反序列化技术点64 载入日志文件10.2.2 UDF、分区、分桶和压缩技术点65 编写UDF ...数据类型11.1.5 操作符和函数11.1.6 交互式和非交互式的Pig11.2 使用Pig 在日志数据中发现恶意行为者...
下推更多的数据类型和函数到 TiKV 计算 优化 `Load Data` 性能,提升 10 倍以上 支持对物理算子内存使用进行统计,通过配置文件以及系统变量指定超过阈值后的处理行为 支持限制单条 SQL 语句使用内存的大小,减少...
2,多数据库支持:目前支持应用最广泛的MS SQL SERVER 2000/2005,MySQL数据库,在后台点点鼠标即可完成数据库数据汇入索引库的匹配; 3,毫秒级的速度:基于倒排索引全文索引技术核心,实现索引分块存储千万级数据...
物理设计 根据特定数据库管理系统所提供的多种存储结构和存取⽅法等依赖于具体计算机结构的各项物理设计措施,对具体的应⽤任务选定最合适的 物理存储结构(包括⽂件类型、索引结构和数据的存放次序与位逻辑等)、...
同时每个查询都可以针对batch、fetchSize、maxResult、缓存、级联操作类型等进行调整和开关,可以将性能调到最优。可在主流数据库之间任意切换 支持Oracle、MySQL、Postgres、MSSQL、GBase、SQLite、HSQL、Derby等...