admin管理员组

文章数量:1122850

位,字节,字,b,B,KB,MB,TB

参考:.html,
下面是参考链接中一段内容

bit(binary digit)比特,这是表示信息的最小单位,它只能表示 0 或 1。
byte(字节),其表示的值范围是0~255(无符号) 或 -127~127(有符号),1 byte = 8 bit,一个英文字母1字节,一个汉字需要2字节(GBK编码)。
KB(Kilobyte),1 KB = 1024 byte,大约四五百个汉字的短篇小说。
MB(Megabyte),1 MB = 1024 KB,五十万多字的内容,《西游记》82万字2 MB就存完。
GB(Gigabyte),1 GB = 1024 MB,大约5.37亿个汉字,历史上字数最多的《永乐大典》有3亿7千万字。
TB(Terabyte),1 TB = 1024 GB,约1.1万亿字节,在线看的720P电影每部大概500MB~1GB大小,可以存放1000多部。
PB(Petabyte),1 PB = 1024 TB,按上例,可以存放100万部电影,人活到100岁也不到90万小时。
EB(Exabyte),1 EB = 1024 PB,相当于52.4万个2T硬盘,一个按300元计算,需要1.57亿人民币(原谅我庸俗)。
ZB(Zettabyte),1 ZB = 1024 EB,以 50MB/秒 的速度下载,需要71.4万年。

简单知识

1,存储单位bit、byte、KB、MB、GB、TB、PB、(平常听说)   EB、ZB、YB、(所有使用)   BB、NB、DB、CB、XB(未来可能使用)
2,计算机计量单位,除去bit,每个单位之间理论上都是以1024=2^32做为转换系数的,但生活中人们都以1000做为转换系数

位bit,(binary digit,b)

计算机中的一个位只能是0或1,是最小单位

字节(byte,B)

8位(bit)二进制,是信息的最小单位
计算机空间中的地址增减是以字节做为最小单位的。但定义数据类型中会发现,一个数据类型可能会占多个字节内存

字(word)

编码方式不同一个字对应的字节数不同,但一般中文字符都是2个字节

简单理解字符为什么占用不同字节

参考:,
导致不同编码方式的主要原因就是编码方式对应的不同语言的的字符集不同。例如英文就26个字母,但中文的字可是很多的。所以出现ASCII码,GB2312(中文简体字),GBK(中文简体和繁体),GB18030(中文,日语,朝鲜语等),UTF-8(俗称万国码)

需要注意的表达16进制表示和字节数量

计算机中是用的二进制进行数据记录和使用,但人们为了方便经常使用16进制进行记录和查看;可以知道一个16进制刚好是4位二进制,所以我们经常看到一个中文汉字的编码写成4位16进制例如”9E45“.但这并不是说一个中文占了4个字节

字符集编码资源

GB2312: GB:国标
GBK: GBK全称《汉字内码扩展规范》
并不存在哪种具体的编码方式叫做ANSI,它只是一个Windows操作系统上的别称而已,在中国就是GBK,在韩语操作系统上,ANSI就是EUC-KR(一种韩语编码)

本文标签: 位,字节字,b,B,KBMBTB