为什么说一个中文占三个字节-博客园

为什么说一个中文占三个字节

2025-06-13 15:29:31 发布 161 浏览

页面报错/反馈

已收藏点赞

缘由

在学习java基础时
对于s2，一个中文占用3个字节，21845个正好占用65535个字节，而且字符串长度是21845，长度和存储也都没超过限制，所以可以编译通过
为啥是三个字节, 不是两个字节吗

java的默认编码格式

java18前使用系统格式

java18后默认utf-8

那我们看看 utf-8的wiki

Unicode

故名思意, 为每个字符(任何语言)提供一个独特编码
以满足跨语言、跨平台的文本信息转换

码点的位数	表示的unicode范围	字节序列	Byte 1	Byte 2	Byte 3
7	0~127	1	`0xxxxxxx`
11	128~2047	2	`110xxxxx`	`10xxxxxx`
16	2048~65535	3	`1110xxxx`	`10xxxxxx`	`10xxxxxx`
21	>65535	4	`11110xxx`	`10xxxxxx`	`10xxxxxx`

比如’中’的unicode为4E2D 4¹⁶16^16 = 16384 >2047

显然是用3位utf-8存储

登录查看全部

参与评论

评论留言

还没有评论留言，赶紧来抢楼吧~~

浏览 2967.01 万次

点击这里给我发消息

手机查看

返回顶部