龙空技术网

char「」 和 String 类型占用字节大小问题

秃头程序员 119

前言:

眼前咱们对“netgbk单字节”大约比较关心,你们都想要学习一些“netgbk单字节”的相关知识。那么小编同时在网上网罗了一些关于“netgbk单字节””的相关文章,希望小伙伴们能喜欢,小伙伴们快快来学习一下吧!

在 C 语言中

1、char a[10] = {"China"} 中,这个 a 占用多少字节?

答:占用 10 个字节。

解析:上面代码对 a 做了赋值的操作,

a[0]='C' ,a[1]='h' ,a[2]='i' ,a[3]='n' ,a[4]='a' ,a[5]='\0',a[6]='\0',a[7]='\0',a[8]='\0',a[9]='\0'

所以,它占用的是 10 个字节。

2、如果单指 ”China“ ?

答:共 6 个字节。China 占 5 个字节,最后以 '\0' 结束,占 1 个字节。

在 Java 语言中

1、String s = "China"; 占多少字节?

答:占 5 个字节。

以上代码,可以输出 "China" 所占的字节长度为 5

2、String s = "中国"; 占多少字节?

答:如果是 汉字 的情况需要考虑编码。

(1)GBK 编码(ide默认)时,每一个汉字占用 2 个字节,那么中国占 4 个字节。

(2)UTF-8 编码时,每一个汉字占用 3 个字节,那么中国占用 6 个字节。

3、转码问题,GBK 转 UTF-8 时,字节占用会变大吗?反过来呢?

如上代码是:UTF-8 转 GBK 编码格式,s 长度从 6 字节变为 9 字节。

s 内容变化:中国 —> 涓浗

因为当前编码是 UTF-8,转码之后变成了 3 个文字,占用 9 个字节。然而,反过来的情况是这样的:

中国 (gbk) —> ?й? (utf-8)

s 长度从 4字节 变成了 4字节,虽然长度没发生改变,但是文字已经改变。这里的 ? 占用 1 个字节。

---------------------

版权声明:本文为CSDN博主「威威喵」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。

原文链接:

标签: #netgbk单字节