二进制与字符编码完全指南

一切从逻辑电路说起

计算机由逻辑电路组成，逻辑电路只有两种状态：开和关。

这两种状态用数字 0 和 1 来表示，这就是二进制的本质。

每个位置只能是 0 或 1，增加位置数量就能表示更多状态：

8 位二进制也称为一个字节（BYTE），是计算机存储的基本单位。

1024 正好是 2¹⁰，这也是为什么计算机中使用二进制换算。

最早的字符编码标准，使用 8 位（1 字节） 表示 128 种符号（0～127）。

ASCII 只覆盖了英文字母和少量符号，无法表示中文和其他语言。

GB18030 中每个字符由 1、2 或 4 个字节组成。

为了解决不同编码互不兼容的问题，Unicode 应运而生。

Unicode 规定每个字符对应一个唯一的数字（称为码点），但它只负责制定编号，不负责如何存储。

UTF-8 是一种变长编码方式：

字符类型	占用字节
英文字母	1 字节（与 ASCII 兼容）
中文等字符	3 字节

例如，汉字「乘」：

在 Python 中可以验证字符编码：

# ord() — 将字符转为对应的整数
print(ord("乘"))   # 输出：20056

# chr() — 将整数转为对应的字符
print(chr(20056)) # 输出：乘

不管是中文还是英文，在计算机中都以字符形式存在，每个字符对应一个整数（可用十进制、二进制、十六进制表示）。最终所有数据都会被转换为二进制，因为计算机只识别 0 和 1。

编程

#Python #编程基础 #字符编码 #二进制

二进制与字符编码完全指南

https://luoshuang.org/2026/04/18/二进制与字符编码完全指南/

作者

LuoShuang

发布于

2026年4月18日

许可协议