Python学习笔记（2.2）Python中的字符编码问题及标准数据类型之String（字符串）-低调大师

Python学习笔记（2.2）Python中的字符编码问题及标准数据类型之String（字符串）

2018-09-01 604

Python3中的String类型

　　首先，Python中没有字符类型，只有字符串类型。单个字符按照长度为1的字符串处理，这对于曾是OIER的我来说有点不适应啊。

　　字符串的表示方法

　　　　最常用的就是用一对双引号或一对单引号把一串字符括起来，像这样 'Hello world!' 或 "Hello world!" 。这两种表示方法可以说完全一样，没啥区别。这两种完全一样的东西存在的目的貌似只有一个，如果字符串中含有一个单引号，就要用双引号括起来，避免单引号匹配不起来，像这样 "I'm fine." 而不是这样 'I'm fine.' ，可以看到，第二种情况下，解释器就无法正确识别我们想要的字符串。再加一个相似的例子： '"Why," he said.' 和 ""Why," he said."

字符编码

　　参考资料：字符串和编码-廖雪峰的官方网站

　　众所周知，计算机要处理字符，是通过字符编码。美国人发明了计算机，然后制定了由一个字节表示一个字符的ASCII编码，只有英文字母、数字、标点和一些控制字符，总共127个。

　　但是这对其他语言来说就很不友好，因为放不下自己语言的字啊。于是各国都制定了自己的编码标准，比如中国的GB2312(国标2312)、GBK(国标扩)，日本的Shift_JIS，等等。各国标准不同，就会出现冲突(乱码)。

　　于是就产生了国际通用的编码标准Unicode（点我看Unicode），发展到如今，大多数由两个字节表示一个字，也有要4个字节的。它包括了全世界差不多所有字符。至于原来就在ASCII中的字符，在编码前面补零就好。

　　但由于“补零”的存在，如果大部分是英文，Unicode储存时要耗费差不多两倍空间，于是储存时由Unicode转换为可变长编码的UTF-8以节约空间(1~6个字节表示一个字，中文大多是3字节)，再次打开时，再转换回Unicode（Windows XP的记事本是这样的，win7记事本保存时就可以自己选编码方式了），网页也有这类似的应用。

　　总结一下：计算机要处理非英文的字符，就要使用其他字符编码，如要处理中文，就要使用GB2312(只支持中文、英文)或Unicode、UTF-8(支持所有语言)。

　　Ps：GBK和UTF-8并不兼容，于是在我刚开始折腾Ubuntu16.04时，发现在里面预装的rhythmbox中，我的音乐标题全是乱码，百度一下，在Ubuntu下处理好了，等重启回到win7时，win7又显示乱码了，解决方案：在Ubuntu下使用网易云音乐。还有当年去福建长乐一中集训，由于编码方式不兼容，我Ubuntu的文件用ftp传到他们那里，文件名只会显示乱码，导致我第一天没有成绩，解决方案：用Windows或Ubuntu下的ftp软件

Python3中的String（字符串）类型编码方式及其应用

　　python3中，字符串类型默认使用Unicode，直接可以处理中文了，不像Python2，默认ASCII，要处理中文还要手动UTF-8。如果要更改编码方式，比如希望使用GBK，那么要加一行注释（叫做编码声明） # -*- coding: gbk -*- 或 #coding=gbk (等号前后不能有空格)，要放在第一行，如果第一行已经有了解析路径（ #!/usr/bin/python3 ），那编码声明就要放在第二行。关于编码声明更详细的官方解释。再次强调，Unicode/UTF-8不与GBK兼容浣犲ソ锛屼笘鐣岋紒。

微信关注我们

原文链接：https://yq.aliyun.com/articles/683510

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

使用JavaScript ES6的新特性计算Fibonacci（非波拉契数列）

程序员面试系列 Java面试系列-webapp文件夹和WebContent文件夹的区别？程序员面试系列：Spring MVC能响应HTTP请求的原因？ Java程序员面试系列-什么是Java Marker Interface（标记接口）使用JDK自带的工具jstack找出造成运行程序死锁的原因编程面试题：编写一个会造成数据库死锁的应用 JavaScript面试系列：JavaScript设计模式之桥接模式和懒加载面试题：用JavaScript开发一个函数，打印非波拉契数列。我们只要记住非波拉契数列的计算公式，就不难写出来了： F(0)=1，F(1)=1, F(n)=F(n-1)+F(n-2) 我写的JavaScript代码如下： var fib = function (a, b) { var _current = a + b; return { current: _current, next: function () { return fib(b, _current); } } } 把当前这一轮的计算结果存储到第二行的变量_current里，并通过属性current返回给调用者...

2018-09-01

545

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/ESA_DSQ/article/details/82320841 资源整理。 1 Coding: 2 Paper: 1 Coding: 1.Nature Climate Change论文”Higher temperatures increase suicide rates in the United States and Mexico”的code，更高的温度会增加美国和墨西哥的自杀率。 NCC2018 论文链接 2.Nature论文”Robust relationship between air quality and infant mortality in Africa”的code，非洲空气质量和婴儿死亡率的密切关系。 HBBB2018 论文链接 3.多模式的非监督图像转换，对抗生成网络相关项目。 MUNIT 4.Predictive Soil Mapping with R书的源码，我曾经有幸在5月份上过作者的关于这方面的课程，Tomislav Hengl老师非常风趣，这本书是基于谢益辉...

2018-09-01

653

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。