给妹子讲python-S01E08理清python中的字符编码方法
上一集讲清楚字符编码的基础概念后我相信这一集再来介绍python中的字符编码就会容易的多。
通过上一集我们知道ASCII码包括其最常见的超集Latin-1依赖这样的一个假设即每一个字符与一个字节相匹配由于存在太多的字符因此不可避免的会出现问题Unicode字符集通过使用4个字节来表示1个字符则解决了该问题。
首先来介绍一下Python中的两种字符串
Python中有两种字符串文本字符串和字节字符串。其中文本字符串类型被命名为str内部采用Unicode字符集兼容ASCII码而字节字符串则直接用来表示原始的字节序列用print函数来打印字节字符串时若字节在ascii码范围内则显示为ascii码对应的字符其余的则直接显示为16进制数该类型被命名为bytes。
看一个简单的例子
s = 'apple'
b = b'apple'
print(b)