首页 文章 精选 留言 我的

精选列表

搜索[最权威安装],共10000篇文章
优秀的个人博客,低调大师

史上便捷搭建Zookeeper服务器的方法

什么是 ZooKeeper ZooKeeper 是 Apache 的一个顶级项目,为分布式应用提供高效、高可用的分布式协调服务,提供了诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知和分布式锁等分布式基础服务。由于 ZooKeeper 便捷的使用方式、卓越的性能和良好的稳定性,被广泛地应用于诸如 Hadoop、HBase、Kafka 和 Dubbo 等大型分布式系统中。 Zookeeper 有三种运行模式:单机模式、伪集群模式和集群模式。 单机模式:这种模式一般适用于开发测试环境,一方面我们没有那么多机器资源,另外就是平时的开发调试并不需要极好的稳定性。 集群模式:一个 ZooKeeper 集群通常由一组机器组成,一般 3 台以上就可以组成一个可用的 ZooKeeper 集群了。组成 ZooKeeper 集群的每台机器都会在内存中维护当前的服务器状态,并且每台机器之间都会互相保持通信。 伪集群模式:这是一种特殊的集群模式,即集群的所有服务器都部署在一台机器上。当你手头上有一台比较好的机器,如果作为单机模式进行部署,就会浪费资源,这种情况下,ZooKeeper允许你在一台机器上通过启动不同的端口来启动多个 ZooKeeper 服务实例,以此来以集群的特性来对外服务。 ZooKeeper 的相关知识 Zookeeper 中的角色 领导者(leader):负责进行投票的发起和决议,更新系统状态 跟随者(follower):用于接收客户端请求并给客户端返回结果,在选主过程中进行投票 观察者(observer):可以接受客户端连接,将写请求转发给 leader,但是observer不参加投票的过程,只是为了扩展系统,提高读取的速度。 Zookeeper 的数据模型 层次化的目录结构,命名符合常规文件系统规范,类似于Linux 每个节点在zookeeper中叫做znode,并且其有一个唯一的路径标识 节点Znode可以包含数据和子节点,但是EPHEMERAL类型的节点不能有子节点 Znode中的数据可以有多个版本,比如某一个路径下存有多个数据版本,那么查询这个路径下的数据就需要带上版本 客户端应用可以在节点上设置监视器 节点不支持部分读写,而是一次性完整读写 ZooKeeper 的节点特性 ZooKeeper 节点是生命周期的,这取决于节点的类型。在 ZooKeeper 中,节点根据持续时间可以分为持久节点(PERSISTENT)、临时节点(EPHEMERAL),根据是否有序可以分为顺序节点(SEQUENTIAL)、和无序节点(默认是无序的)。 持久节点一旦被创建,除非主动移除,不然一直会保存在Zookeeper中(不会因为创建该节点的客户端的会话失效而消失),临时节点 Zookeeper 的应用场景 ZooKeeper 是一个高可用的分布式数据管理与系统协调框架。基于对 Paxos 算法的实现,使该框架保证了分布式环境中数据的强一致性,也正是基于这样的特性,使得 ZooKeeper 解决很多分布式问题。 值得注意的是,ZooKeeper 并非天生就是为这些应用场景设计的,都是后来众多开发者根据其框架的特性,利用其提供的一系列API接口(或者称为原语集),摸索出来的典型使用方法。 数据发布与订阅(配置中心) 发布与订阅模型,即所谓的配置中心,顾名思义就是发布者将数据发布到ZK节点上,供订阅者动态获取数据,实现配置信息的集中式管理和动态更新。例如全局的配置信息,服务式服务框架的服务地址列表等就非常适合使用。 应用中用到的一些配置信息放到ZK上进行集中管理。这类场景通常是这样:应用在启动的时候会主动来获取一次配置,同时,在节点上注册一个Watcher,这样一来,以后每次配置有更新的时候,都会实时通知到订阅的客户端,从来达到获取最新配置信息的目的。 分布式搜索服务中,索引的元信息和服务器集群机器的节点状态存放在ZK的一些指定节点,供各个客户端订阅使用。 分布式日志收集系统。这个系统的核心工作是收集分布在不同机器的日志。收集器通常是按照应用来分配收集任务单元,因此需要在ZK上创建一个以应用名作为path的节点P,并将这个应用的所有机器ip,以子节点的形式注册到节点P上,这样一来就能够实现机器变动的时候,能够实时通知到收集器调整任务分配。 系统中有些信息需要动态获取,并且还会存在人工手动去修改这个信息的发问。通常是暴露出接口,例如JMX接口,来获取一些运行时的信息。引入ZK之后,就不用自己实现一套方案了,只要将这些信息存放到指定的ZK节点上即可。 注意:在上面提到的应用场景中,有个默认前提是:数据量很小,但是数据更新可能会比较快的场景。 负载均衡 这里说的负载均衡是指软负载均衡。在分布式环境中,为了保证高可用性,通常同一个应用或同一个服务的提供方都会部署多份,达到对等服务。而消费者就须要在这些对等的服务器中选择一个来执行相关的业务逻辑,其中比较典型的是消息中间件中的生产者,消费者负载均衡。 命名服务(Naming Service) 命名服务也是分布式系统中比较常见的一类场景。在分布式系统中,通过使用命名服务,客户端应用能够根据指定名字来获取资源或服务的地址,提供者等信息。被命名的实体通常可以是集群中的机器,提供的服务地址,远程对象等等——这些我们都可以统称他们为名字(Name)。其中较为常见的就是一些分布式服务框架中的服务地址列表。通过调用ZK提供的创建节点的API,能够很容易创建一个全局唯一的path,这个path就可以作为一个名称。 阿里巴巴集团开源的分布式服务框架Dubbo中使用ZooKeeper来作为其命名服务,维护全局的服务地址列表。在Dubbo实现中: 服务提供者在启动的时候,向ZK上的指定节点/dubbo/${serviceName}/providers目录下写入自己的URL地址,这个操作就完成了服务的发布。 服务消费者启动的时候,订阅/dubbo/${serviceName}/providers目录下的提供者URL地址, 并向/dubbo/${serviceName} /consumers目录下写入自己的URL地址。 注意,所有向ZK上注册的地址都是临时节点,这样就能够保证服务提供者和消费者能够自动感应资源的变化。 另外,Dubbo还有针对服务粒度的监控,方法是订阅/dubbo/${serviceName}目录下所有提供者和消费者的信息。 分布式通知/协调 ZooKeeper中特有watcher注册与异步通知机制,能够很好的实现分布式环境下不同系统之间的通知与协调,实现对数据变更的实时处理。使用方法通常是不同系统都对ZK上同一个znode进行注册,监听znode的变化(包括znode本身内容及子节点的),其中一个系统update了znode,那么另一个系统能够收到通知,并作出相应处理。 另一种心跳检测机制:检测系统和被检测系统之间并不直接关联起来,而是通过zk上某个节点关联,大大减少系统耦合。 另一种系统调度模式:某系统有控制台和推送系统两部分组成,控制台的职责是控制推送系统进行相应的推送工作。管理人员在控制台作的一些操作,实际上是修改了ZK上某些节点的状态,而ZK就把这些变化通知给他们注册Watcher的客户端,即推送系统,于是,作出相应的推送任务。 另一种工作汇报模式:一些类似于任务分发系统,子任务启动后,到zk来注册一个临时节点,并且定时将自己的进度进行汇报(将进度写回这个临时节点),这样任务管理者就能够实时知道任务进度。 分布式锁 分布式锁,这个主要得益于ZooKeeper为我们保证了数据的强一致性。锁服务可以分为两类,一个是保持独占,另一个是控制时序。 所谓保持独占,就是所有试图来获取这个锁的客户端,最终只有一个可以成功获得这把锁。通常的做法是把zk上的一个znode看作是一把锁,通过create znode的方式来实现。所有客户端都去创建 /distribute_lock节点,最终成功创建的那个客户端也即拥有了这把锁。 控制时序,就是所有视图来获取这个锁的客户端,最终都是会被安排执行,只是有个全局时序了。做法和上面基本类似,只是这里 /distribute_lock 已经预先存在,客户端在它下面创建临时有序节点(这个可以通过节点的属性控制:CreateMode.EPHEMERAL_SEQUENTIAL来指定)。Zk的父节点(/distribute_lock)维持一份sequence,保证子节点创建的时序性,从而也形成了每个客户端的全局时序。 由于同一节点下子节点名称不能相同,所以只要在某个节点下创建znode,创建成功即表明加锁成功。注册监听器监听此znode,只要删除此znode就通知其他客户端来加锁。 创建临时顺序节点:在某个节点下创建节点,来一个请求则创建一个节点,由于是顺序的,所以序号最小的获得锁,当释放锁时,通知下一序号获得锁。 分布式队列 队列方面,简单来说有两种,一种是常规的先进先出队列,另一种是等队列的队员聚齐以后才按照顺序执行。对于第一种的队列和上面讲的分布式锁服务中控制时序的场景基本原理一致,这里就不赘述了。 第二种队列其实是在FIFO队列的基础上作了一个增强。通常可以在 /queue 这个znode下预先建立一个/queue/num 节点,并且赋值为n(或者直接给/queue赋值n),表示队列大小,之后每次有队列成员加入后,就判断下是否已经到达队列大小,决定是否可以开始执行了。这种用法的典型场景是,分布式环境中,一个大任务Task A,需要在很多子任务完成(或条件就绪)情况下才能进行。这个时候,凡是其中一个子任务完成(就绪),那么就去 /taskList 下建立自己的临时时序节点(CreateMode.EPHEMERAL_SEQUENTIAL),当 /taskList 发现自己下面的子节点满足指定个数,就可以进行下一步按序进行处理了。 使用 dokcer-compose 搭建集群 上面我们介绍了关于 ZooKeeper 有这么多的应用场景,那么接下来我们就先学习如何搭建 ZooKeeper 集群然后再进行实战上面的应用场景。 文件的目录结构如下: ├── docker-compose.yml 编写 docker-compose.yml 文件 docker-compose.yml文件内容如下: version: '3.4' services: zoo1: image: zookeeper restart: always hostname: zoo1 ports: - 2181:2181 environment: ZOO_MY_ID: 1 ZOO_SERVERS: server.1=0.0.0.0:2888:3888;2181 server.2=zoo2:2888:3888;2181 server.3=zoo3:2888:3888;2181 zoo2: image: zookeeper restart: always hostname: zoo2 ports: - 2182:2181 environment: ZOO_MY_ID: 2 ZOO_SERVERS: server.1=zoo1:2888:3888;2181 server.2=0.0.0.0:2888:3888;2181 server.3=zoo3:2888:3888;2181 zoo3: image: zookeeper restart: always hostname: zoo3 ports: - 2183:2181 environment: ZOO_MY_ID: 3 ZOO_SERVERS: server.1=zoo1:2888:3888;2181 server.2=zoo2:2888:3888;2181 server.3=0.0.0.0:2888:3888;2181 在这个配置文件中,docker 运行了 3 个 zookeeper 镜像,通过 ports 字段分别将本地的 2181, 2182, 2183 端口绑定到对应容器的 2181 端口上。 ZOO_MY_ID 和 ZOO_SERVERS 是搭建 Zookeeper 集群需要的两个环境变量。ZOO_MY_ID 标识服务的 id,为 1-255 之间的整数,必须在集群中唯一。ZOO_SERVERS 是集群中的主机列表。 在 docker-compose.yml 所在目录下执行 docker-compose up,可以看到启动的日志。 连接 ZooKeeper 将集群启动起来以后我们可以连接 ZooKeeper 对其进行节点的相关操作。 首先我们需要将 ZooKeeper 下载下来。ZooKeeper 下载地址。 将其解压 进入其conf目录中,将zoo_sample .cfg改成zoo.cfg 配置文件说明 # The number of milliseconds of each tick # tickTime:CS通信心跳数 # Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。tickTime以毫秒为单位。 tickTime=2000 # The number of ticks that the initial # synchronization phase can take # initLimit:LF初始通信时限 # 集群中的follower服务器(F)与leader服务器(L)之间初始连接时能容忍的最多心跳数(tickTime的数量)。 initLimit=5 # The number of ticks that can pass between # sending a request and getting an acknowledgement # syncLimit:LF同步通信时限 # 集群中的follower服务器与leader服务器之间请求和应答之间能容忍的最多心跳数(tickTime的数量)。 syncLimit=2 # the directory where the snapshot is stored. # do not use /tmp for storage, /tmp here is just # example sakes. # dataDir:数据文件目录 # Zookeeper保存数据的目录,默认情况下,Zookeeper将写数据的日志文件也保存在这个目录里。 dataDir=/data/soft/zookeeper-3.4.12/data # dataLogDir:日志文件目录 # Zookeeper保存日志文件的目录。 dataLogDir=/data/soft/zookeeper-3.4.12/logs # the port at which the clients will connect # clientPort:客户端连接端口 # 客户端连接 Zookeeper 服务器的端口,Zookeeper 会监听这个端口,接受客户端的访问请求。 clientPort=2181 # the maximum number of client connections. # increase this if you need to handle more clients #maxClientCnxns=60 # # Be sure to read the maintenance section of the # administrator guide before turning on autopurge. # # http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance # # The number of snapshots to retain in dataDir #autopurge.snapRetainCount=3 # Purge task interval in hours # Set to "0" to disable auto purge feature #autopurge.purgeInterval=1 # 服务器名称与地址:集群信息(服务器编号,服务器地址,LF通信端口,选举端口) # 这个配置项的书写格式比较特殊,规则如下: # server.N=YYY:A:B # 其中N表示服务器编号,YYY表示服务器的IP地址,A为LF通信端口,表示该服务器与集群中的leader交换的信息的端口。B为选举端口,表示选举新leader时服务器间相互通信的端口(当leader挂掉时,其余服务器会相互通信,选择出新的leader)。一般来说,集群中每个服务器的A端口都是一样,每个服务器的B端口也是一样。但是当所采用的为伪集群时,IP地址都一样,只能时A端口和B端口不一样。 可以不修改zoo.cfg,默认配置就行,接下来在解压后的 bin 目录中执行命令./zkCli.sh -server 127.0.0.1:2181就能进行连接了。 Welcome to ZooKeeper! 2020-06-01 15:03:52,512 [myid:] - INFO [main-SendThread(localhost:2181):ClientCnxn$SendThread@1025] - Opening socket connection to server localhost/127.0.0.1:2181. Will not attempt to authenticate using SASL (unknown error) JLine support is enabled 2020-06-01 15:03:52,576 [myid:] - INFO [main-SendThread(localhost:2181):ClientCnxn$SendThread@879] - Socket connection established to localhost/127.0.0.1:2181, initiating session 2020-06-01 15:03:52,599 [myid:] - INFO [main-SendThread(localhost:2181):ClientCnxn$SendThread@1299] - Session establishment complete on server localhost/127.0.0.1:2181, sessionid = 0x100001140080000, negotiated timeout = 30000 WATCHER:: WatchedEvent state:SyncConnected type:None path:null [zk: 127.0.0.1:2181(CONNECTED) 0] 接下来我们可以使用命令查看节点了 使用 ls 命令查看当前 ZooKeeper 中所包含的内容 命令:ls / [zk: 127.0.0.1:2181(CONNECTED) 10] ls / [zookeeper] ``` 创建了一个新的 znode 节点“ zk ”以及与它关联的字符串 命令:create /zk myData [zk: 127.0.0.1:2181(CONNECTED) 11] create /zk myData Created /zk [zk: 127.0.0.1:2181(CONNECTED) 12] ls / [zk, zookeeper] [zk: 127.0.0.1:2181(CONNECTED) 13] ``` 获取znode节点zk 命令:get /zk [zk: 127.0.0.1:2181(CONNECTED) 13] get /zk myData cZxid = 0x400000008 ctime = Mon Jun 01 15:07:50 CST 2020 mZxid = 0x400000008 mtime = Mon Jun 01 15:07:50 CST 2020 pZxid = 0x400000008 cversion = 0 dataVersion = 0 aclVersion = 0 ephemeralOwner = 0x0 dataLength = 6 numChildren = 0 ``` 删除znode节点zk 命令:delete /zk [zk: 127.0.0.1:2181(CONNECTED) 14] delete /zk [zk: 127.0.0.1:2181(CONNECTED) 15] ls / [zookeeper] ``` 由于篇幅有限,下篇文章会根据上面提到的 ZooKeeper 应用场景逐一进行用代码进行实现。 ZooKeeper 的Docker配置文件存放处 ZooKeeper 的Docker配置文件存放处 ZooKeeper 的Docker配置文件存放处 大家可以直接从上面拉取项目,启动RocketMQ只需要两步 从 GitHub 上面拉取项目 在 ZooKeeper 文件夹中执行docker-compose up命令 参考文章 http://jm.taobao.org/2011/10/08/1232/ https://zzckm.github.io/2019/04/25/1_Zookeeper%E8%AF%A6%E8%A7%A3/ https://www.cnblogs.com/cyfonly/p/5626532.html http://linfuyan.com/docker-zookeeper-cluster/ https://maizitoday.github.io/post/zookeeper%E5%85%A5%E9%97%A8/

优秀的个人博客,低调大师

史上通俗,彻底搞懂字符乱码问题的本质

1、引言 IM等社交应用的开发工作中,乱码问题也很常见,比如: 1)IM聊天消息中的Emoji表情为什么发给后端后MySQL数据库里会乱码; 2)文件名中带有中文的大文件聊天消息发送后,对方看到的文名是乱码; 3)Http rest接口调用时,后端读取到APP端传过来的参数有中文乱码问题; ... ... 那么,对于乱码这个看似不起眼,但并不是一两话能讲清楚的问题,是很有必要从根源了解字符集和编码原理,知其然知其所以然显然是一个优秀码农的基本素养,所以,便有了本文,希望能帮助到你。 2、正文概述 字符集和编码无疑是IT菜鸟甚至是各种大神的头痛问题。当遇到纷繁复杂的字符集,各种火星文和乱码时,问题的定位往往变得非常困难。 本文内容就将会从原理方面对字符集和编码做个简单的科普介绍,同时也会介绍一些通用的乱码故障定位的方法以方便读者以后能够更从容的定位相关问题。 本文是博主通过自己理解消化后并转化成易懂浅显的表述后的介绍,会尽量以简单明了的文字来从要源讲解字符集、字符编码的概念,以及在遭遇乱码时的一些常用诊断技巧,希望能助你对于“乱码”问题有更深地理解。 3、什么是字符集 在介绍字符集之前,我们先了解下为什么要有字符集。 我们在计算机屏幕上看到的是实体化的文字,而在计算机存储介质中存放的实际是二进制的比特流。那么在这两者之间的转换规则就需要一个统一的标准,否则把我们的U盘插到老板的电脑上,文档就乱码了;小伙伴QQ上传过来的文件,在我们本地打开又乱码了。 于是为了实现转换标准,各种字符集标准就出现了。 简单的说:字符集就规定了某个文字对应的二进制数字存放方式(编码)和某串二进制数值代表了哪个文字(解码)的转换关系。 那么为什么会有那么多字符集标准呢? 这个问题实际非常容易回答。问问自己为什么我们的插头拿到英国就不能用了呢?为什么显示器同时有DVI、VGA、HDMI、DP这么多接口呢?很多规范和标准在最初制定时并不会意识到这将会是以后全球普适的准则,或者处于组织本身利益就想从本质上区别于现有标准。于是,就产生了那么多具有相同效果但又不相互兼容的标准了。 说了那么多我们来看一个实际例子,下面就是“屌”这个字在各种编码下的十六进制和二进制编码结果,怎么样有没有一种很屌的感觉? 4、什么是字符编码 字符集只是一个规则集合的名字,对应到真实生活中,字符集就是对某种语言的称呼。例如:英语,汉语,日语。 对于一个字符集来说要正确编码转码一个字符需要三个关键元素: 1)字库表(character repertoire):是一个相当于所有可读或者可显示字符的数据库,字库表决定了整个字符集能够展现表示的所有字符的范围; 2)编码字符集(coded character set):即用一个编码值code point来表示一个字符在字库中的位置; 3)字符编码(character encoding form):将编码字符集和实际存储数值之间的转换关系。 一般来说都会直接将code point的值作为编码后的值直接存储。例如在ASCII中“A”在表中排第65位,而编码后A的数值是0100 0001也即十进制的65的二进制转换结果。 看到这里,可能很多读者都会有和我当初一样的疑问:字库表和编码字符集看来是必不可少的,那既然字库表中的每一个字符都有一个自己的序号,直接把序号作为存储内容就好了。为什么还要多此一举通过字符编码把序号转换成另外一种存储格式呢? 其实原因也比较容易理解:统一字库表的目的是为了能够涵盖世界上所有的字符,但实际使用过程中会发现真正用的上的字符相对整个字库表来说比例非常低。例如中文地区的程序几乎不会需要日语字符,而一些英语国家甚至简单的ASCII字库表就能满足基本需求。而如果把每个字符都用字库表中的序号来存储的话,每个字符就需要3个字节(这里以Unicode字库为例),这样对于原本用仅占一个字符的ASCII编码的英语地区国家显然是一个额外成本(存储体积是原来的三倍)。算的直接一些,同样一块硬盘,用ASCII可以存1500篇文章,而用3字节Unicode序号存储只能存500篇。于是就出现了UTF-8这样的变长编码。在UTF-8编码中原本只需要一个字节的ASCII字符,仍然只占一个字节。而像中文及日语这样的复杂字符就需要2个到3个字节来存储。 关于字符编码知识的详细讲解请见:《字符编码那点事:快速理解ASCII、Unicode、GBK和UTF-8》。 5、UTF-8和Unicode的关系 看完上面两个概念解释,那么解释UTF-8和Unicode的关系就比较简单了。 Unicode就是上文中提到的编码字符集,而UTF-8就是字符编码,即Unicode规则字库的一种实现形式。 随着互联网的发展,对同一字库集的要求越来越迫切,Unicode标准也就自然而然的出现。它几乎涵盖了各个国家语言可能出现的符号和文字,并将为他们编号。详见:Unicode百科介绍。 Unicode的编号从0000开始一直到10FFFF共分为17个Plane,每个Plane中有65536个字符。而UTF-8则只实现了第一个Plane,可见UTF-8虽然是一个当今接受度最广的字符集编码,但是它并没有涵盖整个Unicode的字库,这也造成了它在某些场景下对于特殊字符的处理困难(下文会有提到)。 6、UTF-8编码简介 为了更好的理解后面的实际应用,我们这里简单的介绍下UTF-8的编码实现方法。即UTF-8的物理存储和Unicode序号的转换关系。 UTF-8编码为变长编码,最小编码单位(code unit)为一个字节。一个字节的前1-3个bit为描述性部分,后面为实际序号部分: 1)如果一个字节的第一位为0,那么代表当前字符为单字节字符,占用一个字节的空间。0之后的所有部分(7个bit)代表在Unicode中的序号; 2)如果一个字节以110开头,那么代表当前字符为双字节字符,占用2个字节的空间。110之后的所有部分(5个bit)加上后一个字节的除10外的部分(6个bit)代表在Unicode中的序号。且第二个字节以10开头; 3)如果一个字节以1110开头,那么代表当前字符为三字节字符,占用3个字节的空间。110之后的所有部分(5个bit)加上后两个字节的除10外的部分(12个bit)代表在Unicode中的序号。且第二、第三个字节以10开头; 4)如果一个字节以10开头,那么代表当前字节为多字节字符的第二个字节。10之后的所有部分(6个bit)和之前的部分一同组成在Unicode中的序号。 具体每个字节的特征可见下表,其中“x”代表序号部分,把各个字节中的所有x部分拼接在一起就组成了在Unicode字库中的序号。如下图所示。 我们分别看三个从一个字节到三个字节的UTF-8编码例子: 细心的读者不难从以上的简单介绍中得出以下规律: 1)3个字节的UTF-8十六进制编码一定是以E开头的; 2)2个字节的UTF-8十六进制编码一定是以C或D开头的; 3)1个字节的UTF-8十六进制编码一定是以比8小的数字开头的。 7、为什么会出现乱码 乱码也就是英文常说的mojibake(由日语的文字化け音译)。 简单的说乱码的出现是因为:编码和解码时用了不同或者不兼容的字符集。 对应到真实生活中:就好比是一个英国人为了表示祝福在纸上写了bless(编码过程)。而一个法国人拿到了这张纸,由于在法语中bless表示受伤的意思,所以认为他想表达的是受伤(解码过程)。这个就是一个现实生活中的乱码情况。 在计算机科学中一样:一个用UTF-8编码后的字符,用GBK去解码。由于两个字符集的字库表不一样,同一个汉字在两个字符表的位置也不同,最终就会出现乱码。 我们来看一个例子,假设我们用UTF-8编码存储“很屌”两个字,会有如下转换: 于是我们得到了E5BE88E5B18C这么一串数值,而显示时我们用GBK解码进行展示,通过查表我们获得以下信息: 解码后我们就得到了“寰堝睂”这么一个错误的结果,更要命的是连字符个数都变了。 8、如何识别乱码的本来想要表达的文字 要从乱码字符中反解出原来的正确文字需要对各个字符集编码规则有较为深刻的掌握。但是原理很简单,这里用以MySQL数据库中的数据操纵中最常见的UTF-8被错误用GBK展示时的乱码为例,来说明具体反解和识别过程。 8.1 第1步:编码 假设我们在页面上看到“寰堝睂”这样的乱码,而又得知我们的浏览器当前使用GBK编码。那么第一步我们就能先通过GBK把乱码编码成二进制表达式。 当然查表编码效率很低,我们也可以用以下SQL语句直接通过MySQL客户端来做编码工作: mysql [localhost] {msandbox} > selecthex(convert('寰堝睂'using gbk)); +-------------------------------------+ | hex(convert('寰堝睂'using gbk)) | +-------------------------------------+ | E5BE88E5B18C | +-------------------------------------+ 1 row inset(0.01 sec) 8.2 第2步:识别 现在我们得到了解码后的二进制字符串E5BE88E5B18C。然后我们将它按字节拆开。 然后套用之前UTF-8编码介绍章节中总结出的规律,就不难发现这6个字节的数据符合UTF-8编码规则。如果整个数据流都符合这个规则的话,我们就能大胆假设乱码之前的编码字符集是UTF-8。 8.3 第3步:解码 然后我们就能拿着E5BE88E5B18C用UTF-8解码,查看乱码前的文字了。 当然我们可以不查表直接通过SQL获得结果: mysql [localhost] {msandbox} ((none)) > selectconvert(0xE5BE88E5B18C using utf8); +------------------------------------+ | convert(0xE5BE88E5B18C using utf8) | +------------------------------------+ | 很屌 | +------------------------------------+ 1 row inset(0.00 sec) 9、常见的IM乱码问题处理之MySQL中的Emoji字符 所谓Emoji就是一种在Unicode位于\u1F601-\u1F64F区段的字符。这个显然超过了目前常用的UTF-8字符集的编码范围\u0000-\uFFFF。Emoji表情随着IOS的普及和微信的支持越来越常见。 下面就是几个常见的Emoji(IM聊天软件中经常会被用到): 那么Emoji字符表情会对我们平时的开发运维带来什么影响呢? 最常见的问题就在于将他存入MySQL数据库的时候。一般来说MySQL数据库的默认字符集都会配置成UTF-8(三字节),而utf8mb4在5.5以后才被支持,也很少会有DBA主动将系统默认字符集改成utf8mb4。 那么问题就来了,当我们把一个需要4字节UTF-8编码才能表示的字符存入数据库的时候就会报错:ERROR 1366: Incorrect string value: '\xF0\x9D\x8C\x86' for column。 如果认真阅读了上面的解释,那么这个报错也就不难看懂了:我们试图将一串Bytes插入到一列中,而这串Bytes的第一个字节是\xF0意味着这是一个四字节的UTF-8编码。但是当MySQL表和列字符集配置为UTF-8的时候是无法存储这样的字符的,所以报了错。 那么遇到这种情况我们如何解决呢? 有两种方式: 1)升级MySQL到5.6或更高版本,并且将表字符集切换至utf8mb4; 2)在把内容存入到数据库之前做一次过滤,将Emoji字符替换成一段特殊的文字编码,然后再存入数据库中。之后从数据库获取或者前端展示时再将这段特殊文字编码转换成Emoji显示。 第二种方法我们假设用-*-1F601-*-来替代4字节的Emoji,那么具体实现python代码可以参见Stackoverflow上的回答。 10、参考文献 [1]如何配置Python默认字符集 [2]字符编码那点事:快速理解ASCII、Unicode、GBK和UTF-8 [3]Unicode中文编码表 [4]Emoji Unicode Table [5]Every Developer Should Know About The Encoding

优秀的个人博客,低调大师

一个简单的WebSocket hello world demo

服务器端代码不超过42行: const WSServer = require("./server.js"); var counter = 0; function createWebsocket() { var host = "127.0.0.1"; var port = "9999"; var wsServer = WSServer.startServer(host, port); console.log("WebSocket server listens to: " + host + ":" + port); wsServer.on('open', (data) => { console.log('WS Client has connected: ' + data); setInterval(function(){ counter++; WSServer.broadcast("Jerry: " + counter ); }, 3000); }); wsServer.on('dataWS', (data) => { console.log('Receive Data from WebUI : ' + data); }); wsServer.on('disconnect', (data) => { console.log('WSServer disconnect:' + data.name); }); wsServer.on('close', (data) => { console.log('WSServer close: ' + data.name); }); wsServer.on('end', (data) => { console.log('WSServer Close: '+data.name); }); wsServer.on('error', (data) => { }); } createWebsocket(); </pre> 代码第10行创建一个WebSocket服务器,监听在9999端口上: 第15~18行每隔3秒发送一个字符串到浏览器,用一个计数器标识每次发送的请求。 代码里所需的server.js我已经上传到我的Github上了: https://github.com/i042416/KnowlegeRepository/blob/master/practice/nodejs/server.js 使用nodejs启动这个服务器: 网页端代码: <html> <script src="socket.io.dev.js"> </script> <script> console.log("1"); var socket = io('ws://127.0.0.1:9999'); socket.on('connect', function(){ console.log("connected!"); }); socket.on('event', function(data){ console.log("event: " + data); }); socket.on('news', function(data){ console.log("data from server: " + JSON.stringify(data,2,2)); }); socket.on('disconnect', function(){ console.log("disconnect..."); }); </script> </html> </pre> 浏览器端每隔三秒收到服务器推送的消息,打印在console上: 本文来自云栖社区合作伙伴“汪子熙”

优秀的个人博客,低调大师

“不限量”只是幌子 流量卡到底哪家划算?

【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 为了能使用到更为实惠的移动流量,相信不少人都会有购买流量卡的打算,而如果是流量需求比较大的用户,则还有不限量流量套餐和日租卡可以选择。 笔者最近正好也有办流量卡的需求,于是便研究了下目前主要的几家流量卡、日租卡和不限量流量套餐,一起来看看那家的流量服务最适合你吧! 1、米粉卡 小米目前已经推出了日租卡和流量卡两种,其中日租卡又分为1元日租卡和不限量日租卡两种。一元日租卡按照1元/日收取,超出800M继续按1元/800M自动叠加扣费,当月累计的总流量达到40GB则暂停当月上网服务。 不限量日租卡按照3元/日收取,省内流量不限量,当月手机上网流量累计达到40GB后,上网速率降至3.1Mbps以下,当月累计达到100GB后,上网速率降至128Kbps,次月恢复4G上网速率。 两种日租卡的国内流量套餐都按照2元包800M/日收取,当天未产生省内流量不收费,用户省内流量超过800MB时,每超出800MB收费2元。 米粉卡还有一种“吃到饱流量卡”可选,用户可选择电信或联通网络,采用固定资费的方式,用户***39元可包1GB全国流量,***188元可包10GB全国流量(电信网络)。 2、腾讯大王卡 腾讯的流量卡主打腾讯应用免流量,分为19元/月腾讯大王卡和59元/月腾讯天王卡,其中腾讯大王卡可享受腾讯专属流量国内免费,省内流量1元/500MB,省外流量2元/500MB,当日有效,自动续订。 而59元的天王卡除了大王卡套餐内的资费外,还拥有500分钟免费国内语音通话。 近日官方还宣布,腾讯王卡再升级——1元1GB国内流量,腾讯大王卡、天王卡套餐用户,只要满足在网时长满12个月(入网当月视为一整月),或可用预存余额达到300元及以上(两个条件满足一个即可),即可申请将日租宝升级为1元1GB国内流量,升级成功后次月1日开始生效。 ↑↑↑免流量腾讯应用(不限于此) 3、蚂蚁宝卡 蚂蚁宝卡是中国联通和蚂蚁金服联合打造的专属流量套餐手机卡,有蚂蚁小宝+卡和蚂蚁大宝卡两种套餐选择,其中蚂蚁小宝+卡为16元/月,包含1GB国内流量,国内接听免费;而蚂蚁大宝卡为36元/月,包括2GB国内流量,外加100分钟国内语音通话。 除了本身的流量套餐外,蚂蚁宝卡还有一些额外的“福利”,比如每月仅需3月就可是享受优酷视频免费特权;10元/1GB国内流量,自动叠加;开通即可添加3个亲情号(联通手机号),国内拨打亲情号免费。 线下消费每笔送20MB国内流量(根据会员等级,每月***可获得20笔);入网首月免月费、开卡寄送2GB全国流量等。 4、招行流量卡 目前招商银行也联合中国联通推出了大招卡和小招卡两款流量卡,其中小招卡为36元/月,套餐包括:2GB国内流量+100分钟国内通话;大招卡为96元/月,套餐包括:6GB国内流量+600分钟国内通话。 同时两款流量卡均可享受10元/1GB的国内流量,并可自动续订。 另外,最近大小招卡也升级了自己的套餐内容,其中小招卡只要满足在网时长满6个月或可用预存余额达到200元及以上,即可在元套餐的基础上,增加500MB国内流量和50分钟通话。 而在网时长满12个月或账户余额达到300元及以上,即可在原套餐基础上,增加1GB全国流量和100分钟全国通话。 而大招卡用户只要满足在网时长满6个月或账户余额在300元及以上,即可在原套餐基础上,增加2GB全国流量,虽然说升级有一定门槛,不过对于老用户来说,升级后流量确实增加了不少。 “不限量”流量套餐真的不限吗? 尽管目前三大运营商都推出了名义上的“不限流量”套餐服务,不过在实际使用的过程中对于流量却存在一定的限制,比如每月流量最多不能超过100GB,超过则闲置网络速率、不同地区收费存在差异、本地/国内流量限制等,下面我们就来看看各家运营的“不限量”流量套餐。 1、中国联通 中国联通所推出的不限流量套餐名为“冰激凌系列”套餐,目前398元档的冰激凌套餐只需要预付99元即可享受199元的套餐月费,其中国内语音和国内流量均不限量。 不过当用户当月全部国内流量达到40GB以后,上网速率将降至7.2Mbps;而当月累计使用100GB后,上网速率降至不足256Kbps,次月恢复。 2、中国移动 中国移动在今年的五月份推出的任我用套餐则,而在近期又推出了流量不限量98元套餐,其中包含2GB国内流量、200分钟国内拨打国内电话时长、加赠不限量省内流量,超出后国内流量0.29元/MB、国内拨打国内电话0.19元/分钟。 主副卡当月产生的流量累计达到40GB后,当月网速不高于1Mbps,后续国内流量不再收费。 而针对老用户,中国移动则还有一个238元的流量套餐,其中国内流量不限量,并赠送5GB*12个月国内流量,以及500分钟通话时长,当用户当月使用流量超出后,当每月全国流量达到15GB后,网速将降至不高于1MB/秒,当月全部流量使用达到100GB后,停止上网功能,次月恢复。 3、中国电信 中国电信提供给用户的选择是199/月的“天翼不限量套餐”,在该套餐中为用户提供了40GB的4G流量,3000分钟的国内通话时间,而全国接听以及来电显示都是免费的。 当用户使用的流量超过了40GB后,上网速率将降至3G网络速度,而当月累计使用达到100GB后,上网速率将降至128Kbps,次月恢复。 *温馨提示:各大运营商提供的不限量流量套餐费用及内容在不同时间、地区均可能会存在一定差异,请以当地运营商公布的信息为准。 三大运营商的日租卡好用吗? 为了适应用户的使用需求,目前三大移动运营商还推出了日租卡套餐选择,而从日租卡的套餐设置上来看,主要针对一些流量需求比较大的本地用户,因为流量套餐中只包含了本地流量,国内流量其实是按照正常的资费收取,价格过高,使用并不划算,下面就来看看三家各自的“日租卡”服务。 1、移动日租卡 移动目前只推出了一种日租卡,月服务费为8元,可享受1元500MB本地流量,同时自动叠加,而国内流量为0.29元/MB,相当于60元/GB。在通话上,国内主叫0.25元/分钟,国内接听免费。 2、联通日租卡 联通也只推出了一种日租卡,月服务费为5元,包括50MB本地流量,流量则是1元/500MB本地流量,同时可以自动叠加,国内漫游流量则为0.27元/MB,基本与移动日租卡的全国流量资费相同。在通话上,国内通话0.15元/分钟,全国接听免费。 3、电信日租卡 电信也推出了一款名为“超级日租卡”的4G套餐,月租6元,该套餐包含30分钟的国内通话时间,国内接听免费,每天1元可用1GB的本地流量,省内及国内流量30元/500MB。相对于中国移动和中国联通的4G日租卡,电信1元/1GB的本地流量无疑具有一定的竞争优势。 总结: 目前三大移动运营商和各大平台都推出了各自不同的流量卡套餐服务,在一定程度上也降低了用户使用流量的资费,不过相应的限制门槛也不少,尤其在不限量流量卡中,其实都对流量做了“封顶”限制。 尽管如此,但对于有流量需求的用户来说,日租卡和不限量流量套餐也给他们带来了真正的实惠。 如果需要的话,大家都可以随时办理。不过需要提醒大家一点,如果你没有双卡双待的手机(苹果用户可能无故躺枪了),那么办理流量卡就意味着你可能还需要一台备用手机了。

资源下载

更多资源
腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。