char与varchar 静态表与动态表

本文通过实验对比了myisam引擎中char和varchar在插入、查询、更新操作上的性能差异,发现char在某些场景下可能不如varchar高效。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

char的总结:
char最大长度是255字符,注意是字符数和字符集没关系。可以有默认值,尾部有空格会被截断。
varchar的总结:
varchar的最大长度65535是指能存储的字节数,其实最多只能存储65532个字节,还有3个字节用于存储长度。注意是字节数这个和字符集有关系。一个汉字字符用utf8占用3字节,用gbk占用2字节。可以有默认值,尾部有空格不会截断。
text的总结:
text和varchar基本相同。text会忽略指定的大小这和varchar有所不同,text不能有默认值。尾部有空格不会被截断。text使用额外的2个字节来存储数据的大小,varchar根据存储数据的大小选择用几个字节来存储。text的65535字节全部用来存储数据,varchar则会占用1-3个字节去存储数据大小。

在长度很不固定情况下使用char或静态表是很不理想的事,myisam引擎中,(char)静态表又或者char的长处在于更新操作,读取(不使用索引读取)和插入相比varchar又或动态表,并无优势。

varchar(10) 存储的是字符数。

对比char和varchar随便在google或百度中搜一下得到的结论大概都是"char定长,varchar不定长,char要比varchar占用更多的空间,由于定长char的效率高于varchar,char最大255,varchar最大65536"更高级一点的数据是"char在存入和取出的时候,会自动把末尾的空格去掉,varchar会额外的多用1-2个字节来存放字符长度,列中有一个varchar会自动把char转换成varchar,而当varchar长度小于4时,自动的把varchar转换成char..."
一般认为空间换时间,现在磁盘又大又不值钱!
当使用全表都是char这的字段的时候,那么表属性Row_format是Fixed也就是静态表,与之对应的自然就是动态表Dynamic,静态表比动态表效率要高,主要是因为,基于两点:
1)没有碎片,每行的长度是固定,所以在频繁更新的场景下,尤其是某个字段由小变大.
2)方便数据文件指针的操作,在myisam中有一个数据文件指针的概念,是用来指向数据文件,比如在索引中指向数据文件.静态表的偏移量的固定不变的,而在动态表中每行的数据长度大小不一,就可能导致数据更多的开销
基于以上两点,所以静态表在查询,修改拥有较大优势,但是这个优势也是有适用场景的.
首先猜想char由于每次存取都会自动的削掉末尾的空格,而且数据文件也大,所以会使用更多的cpu和内存资源,尤其在取的时候,要是长短差距较大的时候,还是会很浪费操作的.
其次验证想法,首先测试插入性能,建了2张表并调用sp分别插入200W的数据
CREATE TABLE `isam_char` (
`content` char(255) NOT NULL
) ENGINE=MyISAM DEFAULT CHARSET=utf8;
CREATE TABLE `isam_vc` (
`content` varchar(255) NOT NULL
) ENGINE=MyISAM DEFAULT CHARSET=utf8;
call insert_isam(2000000,'isam_char');
call insert_isam(2000000,'isam_vc');
多次平均isam_char插入200W的数据为138.21s,而isam_vc少了约20s为119.80s,这应该是每次插入的时候,mysql要把char字段填充到255的操作.观察数据文件大小,isam_vc为235.8M而isam_char为1.4G!
再测试查询,为了保证两者一致,首先把isam_char中数据删除,再把isam_vc中数据导入isam_char中,无索引,禁闭query_cache
truncate table isam_char;##观察了下数据文件,被穷空成0
insert into isam_char select * from isam_vc;##观察了下数据文件,依然是1.4G
select * from isam_char limit 1555555,5;
select * from isam_vc limit 1555555,5;
依旧多次查询去平均值,isam_char表平均值为10.50s,而isam_vc则为1.51s!
再看下创建索引,以及索引的使用情况
mysql> create index index_char on isam_char(content);
Query OK, 2000001 rows affected (2 min 56.33 sec)
Records: 2000001 Duplicates: 0 Warnings: 0
mysql> create index index_vc on isam_vc(content);
Query OK, 2000001 rows affected (1 min 31.98 sec)
Records: 2000001 Duplicates: 0 Warnings: 0
mysql> select count(*) from isam_char where content=('iamauperman!iwillbeahero!!');
+----------+
| count(*) |
+----------+
| 199669 |
+----------+
1 row in set (0.56 sec)
mysql> select count(*) from isam_vc where content=('iamauperman!iwillbeahero!!');
+----------+
| count(*) |
+----------+
| 199669 |
+----------+
1 row in set (0.31 sec)
还是不理想,所以在长度很不固定情况下使用char或静态表是很不理想的事,当然这里做的是全索引扫描,动态表的索引要小于动态表,估计最大的优势是使用索引去找数据和update,为了验证,再次测试update.
mysql> update isam_char set content='iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!';
Query OK, 2000001 rows affected (54 min 54.25 sec)
Rows matched: 2000001 Changed: 2000001 Warnings: 0
mysql> update isam_vc set content='iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!iwillbeahero!!iamauperman!';
Query OK, 2000001 rows affected (1 hour 59 min 25.73 sec)
Rows matched: 2000001 Changed: 2000001 Warnings: 0
果然啊,更新200W的数据差了1倍多!同时动态表的数据增大为480.7M.顺便读了几次数据,依然有差距
mysql> select count(*) from isam_vc IGNORE INDEX(index_vc) where content='iamauperman!iwillbeahero!
!';
+----------+
| count(*) |
+----------+
| 0 |
+----------+
1 row in set (10.55 sec)
mysql> select count(*) from isam_char IGNORE INDEX(index_char) where content='iamauperman!iwillbeah
ero!!';
+----------+
| count(*) |
+----------+
| 0 |
+----------+
1 row in set (14.98 sec)
不使用索引,做全表扫描,动态表快于静态表,这可能是数据文件大小的差异吧.
由于数据源和时间的问题,今天就不做扫描完索引再去读数据的实验了.
基本得出结论:mysql里,准确的说是myisam引擎中,静态表又或者char的长处在于更新操作,读取(不使用索引读取)和插入相比varchar又或动态表,并无优势.
本测试环境为winXP+mysql-5.1.44-community,配置为mysql默认配置.无修改.
注:做这个测试说明我好奇心很强,还有就是我真的很无聊,假如你看了,觉得错了,有明显漏洞的地方,欢迎指正!你也别骂我,我知道我是菜鸟,mysql程序不是有个选项叫做—i-am-a-dummy吗,我就是一个dummy,呵呵,浪费你的时候,我知道我错了!
附:插数据的sp
CREATE DEFINER=`root`@`localhost` PROCEDURE `insert_isam`(p int,t char(10))
begin
set @i = 0;
set @str = "iamauperman!iwillbeahero!!";
repeat
#select name into @str from mysql.help_topic order by rand() limit 1;
set @str=substr(@str,1,25);
set @ins_str = repeat(@str,floor(rand()*10));
set @cmd=concat('insert into ',t,' (content) values("',@ins_str,'")');
prepare stmt from @cmd;
execute stmt;
set @i = @i+1;
until @i > p end repeat;
end
<think>好的,我现在需要详细思考用户关于CHARVARCHAR区别的问题。用户之前已经询问过如何创建宿舍名单的SQL表结构,现在进一步探讨数据类型的选择,特别是CHARVARCHAR的区别。这说明用户可能在设计数据库时遇到了存储效率或字段长度的问题,或者想更深入理解这两种数据类型的适用场景。 首先,我需要回忆CHARVARCHAR的基本定义。CHAR是定长字符串,无论实际数据长度如何,都会占用定义的长度空间。例如,CHAR(5)存储"abc"会占用5个字符的空间,剩余部分用空格填充。而VARCHAR是变长字符串,根据实际数据长度分配存储空间,外加额外的字节来记录长度。比如VARCHAR(5)存储"abc"只会占用3个字符的空间加上长度信息。 接下来,要比较两者的存储方式。CHAR由于是定长,可能会有空间浪费,但读取速度快,因为长度固定,便于预计算存储位置。VARCHAR节省空间,但可能会有额外的开销,因为需要存储长度信息,并且在修改数据时可能导致行溢出,影响性能。 适用场景方面,CHAR适合存储长度相对固定且较短的字符串,比如性别、国家代码等。而VARCHAR适合长度变化较大的数据,如用户名、地址等。需要提醒用户注意数据库系统的具体实现,比如在某些系统中,VARCHAR可能有最大长度限制,或者在处理非常短的字符串时,CHAR可能更高效。 用户之前的问题中,他们使用了CHAR(5)来存储姓名,这可能存在问题,因为中文姓名可能超过5个字符,比如复姓或较长的名字。建议改用VARCHAR并适当调整长度,比如VARCHAR(10)或更长的,以适应不同的情况。这也是之前回复中提到的优化点,所以需要保持一致性。 此外,需要注意不同数据库系统对CHARVARCHAR的处理可能略有不同,比如是否自动去除末尾空格,最大长度限制等。例如,MySQL中VARCHAR最多可以存储65535字节,但实际长度还受行大小限制。而CHAR在存储时会填充空格,检索时会自动去除,这可能导致一些意想不到的行为,比如比较时忽略末尾空格。 还需要考虑性能方面。如果表中的列多数为定长数据,使用CHAR可以让整个表成为静态表,提高查询效率。反之,如果有很多变长字段,使用VARCHAR节省空间,但可能影响查询速度。在内存和磁盘空间之间需要权衡。 可能用户没有考虑到字符集的影响,比如UTF-8下,每个字符可能占用多个字节,CHAR(5)可能会占用更多的存储空间。而VARCHAR在这种情况下,实际存储的字节数会根据字符而变化,更加灵活。 最后,需要以清晰的结构将这些点整理出来,确保用户能够逐步理解两者的区别,并应用到实际数据库设计中。同时,结合之前的例子,说明为何在姓名字段中使用VARCHAR更合适,加强用户的理解。</think>以下是关于 **CHAR** 和 **VARCHAR** 数据类型的详细对比分析: --- ### 一、核心区别总结 | **特性** | **CHAR** | **VARCHAR** | |----------------|-----------------------------------|---------------------------------| | **存储方式** | 定长字符串(固定分配空间) | 变长字符串(按需分配空间) | | **空格处理** | 自动填充空格至定义长度 | 不填充,保留原始长度 | | **存储效率** | 可能浪费空间(短数据时) | 更节省空间(适应不同长度) | | **查询速度** | 较快(长度固定,无需计算) | 稍慢(需读取长度信息) | | **适用场景** | 长度固定的短字符串(如编码、标志) | 长度变化较大的字符串(如描述、名称) | --- ### 二、存储机制详解 1. **CHAR** - 定义示例:`CHAR(5)` - 存储行为: - 存入"abc" ➔ 实际存储为`'abc '`(补2个空格) - 始终占用**5个字符**的存储空间 - 特点: - 读取时自动去除末尾空格 - 比较操作忽略末尾空格(`'a' = 'a '`返回`True`) 2. **VARCHAR** - 定义示例:`VARCHAR(5)` - 存储行为: - 存入"abc" ➔ 实际存储`'abc'`(占用3字符 + 长度信息1-2字节) - 最大占用空间 = 定义长度 + 额外长度标识(通常1-2字节) - 特点: - 保留所有空格(包括末尾) - 比较操作严格区分空格(`'a' ≠ 'a '`) --- ### 三、性能空间对比 - **空间效率**(假设字段定义为`CHAR(10)` vs `VARCHAR(10)`): | 输入值 | CHAR占用空间 | VARCHAR占用空间 | |-------------|-------------|-----------------| | "Hi" | 10字节 | 2字节 + 1字节长度标识 = **3字节** | | "Hello" | 10字节 | 5字节 + 1字节长度标识 = **6字节** | | "HelloWorld"| 10字节(截断)| 10字节 + 1字节长度标识 = **11字节**(若允许存储) | - **性能影响**: - `CHAR`在频繁查询的固定长度字段中更快(如状态码、性别) - `VARCHAR`在大文本或长度变化大的字段中更高效(如评论、地址) --- ### 四、使用场景建议 1. **优先使用 CHAR** - 字段值长度**完全固定**(如:`性别 ENUM('男','女')`) - 字段值**短且频繁查询**(如:`国家代码 CHAR(2)`) 2. **优先使用 VARCHAR** - 字段值长度**变化较大**(如:`姓名 VARCHAR(20)`) - 需要**节省存储空间**(如:长文本描述`VARCHAR(255)`) - 包含**末尾空格需保留**的场景(如:密码字段) --- ### 五、实际案例演示 ```sql -- 示例表 CREATE TABLE test ( fixed_code CHAR(3), -- 定长编码(如"CN"/"US") dynamic_desc VARCHAR(50) -- 变长描述 ); -- 插入数据 INSERT INTO test VALUES ('CN', '中国北京市'), ('US', '美国加利福尼亚州'); -- 查询结果 SELECT fixed_code, LENGTH(fixed_code) AS char_length, -- 始终返回3 LENGTH(dynamic_desc) AS varchar_length -- 返回实际长度 FROM test; ``` --- ### 六、注意事项 1. **字符集影响**: - UTF-8等变长编码下,`CHAR(n)`实际存储空间可能超过`n`字节(如中文占3字节/字符) 2. **数据库兼容性**: - 某些数据库(如Oracle)用`VARCHAR2`替代`VARCHAR`,需注意语法差异 3. **设计原则**: - 避免过度使用`CHAR`导致存储浪费 - `VARCHAR`最大长度需根据业务需求合理设定(如`VARCHAR(255)`是常见选择)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值