您现在的位置是:首页 > 文章详情

Python学习-字符编码浅析

日期:2018-07-26点击:410

1.什么是字符编码

既然是简述那肯定是简单明了.字符编码,看名字就是一种字符的编码格式,由于计算机内部采用二进制,想要将人类的语言字符输入到计算机就需要一种编码格式,这就是字符编码.字符-------编码(字符编码表)----->二进制.

计算机存取人类输入的内容并不是直接保存的,因为计算机并不懂人的语言,每个国家还有每个国家的语言.那么怎么办呢?于是就有一种统一的规定,人类输入到内存中的信息都存为uncode字符编码格式的,再由内存存入计算机硬盘.硬盘有很多种编码格式,这是因为为了向下兼容.而我们在学习时只需要大致了解就行了.

unicode:目前的计算机内存使用的就是这种编码格式,能够兼容万国的字符,与别的字符编码都有一种对应关系.

utf-8:英文名为(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码.

gbk:是为了兼容汉字的字符编码

2.python2与python3的区别

python2:在python2中将文件读入到内存中使,解释器默认使用的是ASCII码.但是在文件的首行写上 coding:utf-8,解释器就会按将utf-8作为编码标准不再使用默认的字符编码,这就是文件头了.

python3:解释器默认使用utf-8

 

总结:为了保证不乱码的关键! 字符当初存储在计算机中使是用什么编码的,就应该用什么解码.

焚膏油以继晷,恒兀兀以穷年。
原文链接:https://yq.aliyun.com/articles/642674
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章