数据库varchar长度最佳实践

BitLuminaryPro
• 阅读 15989

http://dba.stackexchange.com/questions/76469/mysql-varchar-length-and-...

主要以mysql的InnoDB或MyISAM为例,其他数据库中基本也有varchar类型并需要提供长度的参数。
需要说明的是,例如VARCHAR(3)表示的是这一列最多存3个字符而不是3个字节,比如可以存“一二三”,实际存储时是编码为utf-8的。

在mysql中,VARCHAR(3)VARCHAR(255)在存储方式上是没有区别的,都是1个字节表示字符串长度和字符串经utf-8编码后的字节。mysql5.0.3以前的版本varchar的最大长度就是255,之后是65535。而VARCHAR(256)之后表示长度的字节数会变成2个。其实在今天来说多一个字节也没什么区别,但为了兼容性,通常的数据库设计中还是会出现很多VARCHAR(255)

但事实上,把所有较短的字符串列都设为VARCHAR(255)并不是最好的做法。尽管InnoDB是动态存储的,但别的数据库引擎不一定是如此。有的可能会使用固定长度的行,或者固定大小的内存表。内存表即为sql查询中产生的临时表。它通常会为varchar类型分配最大的空间,比如utf-8编码下,内存表可能要为VARCHAR(255)分配2+3×255字节(2是因为存的是字节长度而不是字符长度),如果行数非常多,这也会带来性能问题。不管其中每一行存储的数据是长还是短。另外也注意到InnoDB的单列索引每个结点的最大是767字节(即2+3×255)。

InnoDB最大的行的大小是半个database page(大约8000字节),如果可变长的列(如varbinary、varchar、text、blob)超过了这个大小会被存到外面去,行里面只是存一个指针。这会比存inline慢很多。提到这个不得不说一下text类型,text的存储方法应该和varchar也没什么区别,就是没有长度的限制,因此它在有join等产生中间结果的查询中会非常慢。

所以结论是,我们应该用尽可能小的类型而不是统一用VARCHAR(255)

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
美凌格栋栋酱 美凌格栋栋酱
6个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
待兔 待兔
1年前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Stella981 Stella981
3年前
Python3:sqlalchemy对mysql数据库操作,非sql语句
Python3:sqlalchemy对mysql数据库操作,非sql语句python3authorlizmdatetime2018020110:00:00coding:utf8'''
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
Oracle按月自动进行表分区
createtableHIP\_LOG\_NODE\_Part(   ID                  VARCHAR2(32)        notnull,   LOG\_ID              VARCHAR2(32),   BUSINESS\_ID         VARCHAR2(36),
Wesley13 Wesley13
3年前
thinkphp 基本配置
12returnarray(34//定义数据库连接信息5'DB\_TYPE''mysql',//指定数据库是mysql67'DB\_HOST''localhost',89'DB\_NAME''uchome',//数据库名1011'DB\_USER''root
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这