《快学 Go 语言》第 5 课 —— 神奇的切片-低调大师

《快学 Go 语言》第 5 课 —— 神奇的切片

2018-11-11 528

切片无疑是 Go 语言中最重要的数据结构，也是最有趣的数据结构，它的英文词汇叫 slice。所有的 Go 语言开发者都津津乐道地谈论切片的内部机制，它也是 Go 语言技能面试中面试官最爱问的知识点之一。初级用户很容易滥用它，这小小的切片想要彻底的理解它是需要花费一番功夫的。在使用切片之前，我觉得很有必要将切片的内部结构做一下说明。

学过 Java 语言的人会比较容易理解切片，因为它的内部结构非常类似于 ArrayList，ArrayList 的内部实现也是一个数组。当数组容量不够需要扩容时，就会换新的数组，还需要将老数组的内容拷贝到新数组。ArrayList 内部有两个非常重要的属性 capacity 和 length。capacity 表示内部数组的总长度，length 表示当前已经使用的数组的长度。length 永远不能超过 capacity。

37bad8928c9c72ac893122d703146a3970833dad

图片

上图中一个切片变量包含三个域，分别是底层数组的指针、切片的长度 length 和切片的容量 capacity。切片支持 append 操作可以将新的内容追加到底层数组，也就是填充上面的灰色格子。如果格子满了，切片就需要扩容，底层的数组就会更换。

形象一点说，切片变量是底层数组的视图，底层数组是卧室，切片变量是卧室的窗户。通过窗户我们可以看见底层数组的一部分或全部。一个卧室可以有多个窗户，不同的窗户能看到卧室的不同部分。

切片的创建

切片的创建有多种方式，我们先看切片最通用的创建方法，那就是内置的 make 函数

package main

import "fmt"

func main() {
var s1 []int = make([]int, 5, 8)
var s2 []int = make([]int, 8) // 满容切片

fmt.Println(s1)

fmt.Println(s2)

}


-------------

[0 0 0 0 0]

[0 0 0 0 0 0 0 0]

make 函数创建切片，需要提供三个参数，分别是切片的类型、切片的长度和容量。其中第三个参数是可选的，如果不提供第三个参数，那么长度和容量相等，也就是说切片的满容的。切片和普通变量一样，也可以使用类型自动推导，省去类型定义以及 var 关键字。比如上面的代码和下面的代码是等价的。

package main

import "fmt"

func main() {
var s1 = make([]int, 5, 8)

s2 := make([]int, 8)

fmt.Println(s1)

fmt.Println(s2)

}


-------------

[0 0 0 0 0]

[0 0 0 0 0 0 0 0]

切片的初始化

使用 make 函数创建的切片内容是「零值切片」，也就是内部数组的元素都是零值。Go 语言还提供了另一个种创建切片的语法，允许我们给它赋初值。使用这种方式创建的切片是满容的。

package main

import "fmt"

func main() {
var s []int = []int{1,2,3,4,5} // 满容的

fmt.Println(s, len(s), cap(s))

}


---------

[1 2 3 4 5] 5 5

Go 语言提供了内置函数 len() 和 cap() 可以直接获得切片的长度和容量属性。

空切片

在创建切片时，还有两个非常特殊的情况需要考虑，那就是容量和长度都是零的切片，叫着「空切片」，这个不同于前面说的「零值切片」。

package main

import "fmt"

func main() {
var s1 []int
var s2 []int = []int{}
var s2 []int = make([]int, 0)

fmt.Println(s1, s2, s3)

fmt.Println(len(s1), len(s2), len(s3))

fmt.Println(cap(s1), cap(s2), cap(s3))

}


-----------

[] [] []
0 0 0
0 0 0

上面三种形式创建的切片都是「空切片」，不过在内部结构上这三种形式是有差异的，甚至第一种都不叫「空切片」，而是叫着「 nil 切片」。但是在形式上它们几乎一摸一样，用起来差不多没有区别。所以初级用户可以不必区分「空切片」和「 nil 切片」，到后续章节我们会仔细分析这两种形式的区别。

切片的赋值

切片的赋值是一次浅拷贝操作，拷贝的是切片变量的三个域，你可以将切片变量看成长度为 3 的 int 型数组，数组的赋值就是浅拷贝。拷贝前后两个变量共享底层数组，对一个切片的修改会影响另一个切片的内容，这点需要特别注意。

package main

import "fmt"

func main() {
var s1 = make([]int, 5, 8)
// 切片的访问和数组差不多
for i := 0; i < len(s1); i++ {

s1[i] = i + 1

}
var s2 = s1

fmt.Println(s1, len(s1), cap(s1))

fmt.Println(s2, len(s2), cap(s2))

// 尝试修改切片内容

s2[0] = 255

fmt.Println(s1)

fmt.Println(s2)

}


--------

[1 2 3 4 5] 5 8

[1 2 3 4 5] 5 8

[255 2 3 4 5]

[255 2 3 4 5]

从上面的输出中可以看到赋值的两切片共享了底层数组。

切片的遍历

切片在遍历的语法上和数组是一样的，除了支持下标遍历外，那就是使用 range 关键字

package main


import "fmt"


func main() {
var s = []int{1,2,3,4,5}
for index := range s {

fmt.Println(index, s[index])

}
for index, value := range s {

fmt.Println(index, value)

}

}


--------
0 1
1 2
2 3
3 4
4 5
0 1
1 2
2 3
3 4
4 5

文章开头提到切片是动态的数组，其长度是可以变化的。什么操作可以改变切片的长度呢，这个操作就是追加操作。切片每一次追加后都会形成新的切片变量，如果底层数组没有扩容，那么追加前后的两个切片变量共享底层数组，如果底层数组扩容了，那么追加前后的底层数组是分离的不共享的。如果底层数组是共享的，一个切片的内容变化就会影响到另一个切片，这点需要特别注意。

package main

import "fmt"

func main() {
var s1 = []int{1,2,3,4,5}

fmt.Println(s1, len(s1), cap(s1))

// 对满容的切片进行追加会分离底层数组
var s2 = append(s1, 6)

fmt.Println(s1, len(s1), cap(s1))

fmt.Println(s2, len(s2), cap(s2))

// 对非满容的切片进行追加会共享底层数组
var s3 = append(s2, 7)

fmt.Println(s2, len(s2), cap(s2))

fmt.Println(s3, len(s3), cap(s3))

}


--------------------------

[1 2 3 4 5] 5 5

[1 2 3 4 5] 5 5

[1 2 3 4 5 6] 6 10

[1 2 3 4 5 6] 6 10

[1 2 3 4 5 6 7] 7 10

正是因为切片追加后是新的切片变量，Go 编译器禁止追加了切片后不使用这个新的切片变量，以避免用户以为追加操作的返回值和原切片变量是同一个变量。

package main

import "fmt"

func main() {
var s1 = []int{1,2,3,4,5}
append(s1, 6)

fmt.Println(s1)

}


--------------

./main.go:7:8: append(s1, 6) evaluated but not used

如果你真的不需要使用这个新的变量，可以将 append 的结果赋值给下划线变量。下划线变量是 Go 语言特殊的内置变量，它就像一个黑洞，可以将任意变量赋值给它，但是却不能读取这个特殊变量。

package main

import "fmt"

func main() {
var s1 = []int{1,2,3,4,5}

_ = append(s1, 6)

fmt.Println(s1)

}


----------

[1 2 3 4 5]

还需要注意的是追加虽然会导致底层数组发生扩容，更换的新的数组，但是旧数组并不会立即被销毁被回收，因为老切片还指向这旧数组。

切片的域是只读的

我们刚才说切片的长度是可以变化的，为什么又说切片是只读的呢？这不是矛盾么。这是为了提醒读者注意切片追加后形成了一个新的切片变量，而老的切片变量的三个域其实并不会改变，改变的只是底层的数组。这里说的是切片的「域」是只读的，而不是说切片是只读的。切片的「域」就是组成切片变量的三个部分，分别是底层数组的指针、切片的长度和切片的容量。这里读者需要仔细咀嚼。

切割切割

到目前位置还没有说明切片名字的由来，既然叫着切片，那总得可以切割吧。切割切割，有些男娃子听到这个词汇时身上会起鸡皮疙瘩。切片的切割可以类比字符串的子串，它并不是要把切片割断，而是从母切片中拷贝出一个子切片来，子切片和母切片共享底层数组。下面我们来看一下切片究竟是如何切割的。

package main

import "fmt"

func main() {
var s1 = []int{1,2,3,4,5,6,7}
// start_index 和 end_index，不包含 end_index
// [start_index, end_index)
var s2 = s1[2:5] 

fmt.Println(s1, len(s1), cap(s1))

fmt.Println(s2, len(s2), cap(s2))

}


------------

[1 2 3 4 5 6 7] 7 7

[3 4 5] 3 5

上面的输出需要特别注意的是，既然切割前后共享底层数组，那为什么容量不一样呢？解释它我必须要画图了，读者请务必仔细观察下面这张图

84affa2117bc03fae2a07480aed3f05d335f4558

图片

我们注意到子切片的内部数据指针指向了数组的中间位置，而不再是数组的开头了。子切片容量的大小是从中间的位置开始直到切片末尾的长度，母子切片依旧共享底层数组。

子切片语法上要提供起始和结束位置，这两个位置都可选的，不提供起始位置，默认就是从母切片的初始位置开始（不是底层数组的初始位置），不提供结束位置，默认就结束到母切片尾部（是长度线，不是容量线）。下面我们看个例子

package main

import "fmt"

func main() {
var s1 = []int{1, 2, 3, 4, 5, 6, 7}
var s2 = s1[:5]
var s3 = s1[3:]
var s4 = s1[:]

fmt.Println(s1, len(s1), cap(s1))

fmt.Println(s2, len(s2), cap(s2))

fmt.Println(s3, len(s3), cap(s3))

fmt.Println(s4, len(s4), cap(s4))

}


-----------

[1 2 3 4 5 6 7] 7 7

[1 2 3 4 5] 5 7

[4 5 6 7] 4 4

[1 2 3 4 5 6 7] 7 7

细心的同学可能会注意到上面的 s1[:] 很特别，它和普通的切片赋值有区别么？答案是没区别，这非常让人感到意外，同样的共享底层数组，同样是浅拷贝。下面我们来验证一下

package main

import "fmt"

func main() {
var s = make([]int, 5, 8)
for i:=0;i<len(s);i++ {

s[i] = i+1

}

fmt.Println(s, len(s), cap(s))

var s2 = s
var s3 = s[:]

fmt.Println(s2, len(s2), cap(s2))

fmt.Println(s3, len(s3), cap(s3))

// 修改母切片

s[0] = 255

fmt.Println(s, len(s), cap(s))

fmt.Println(s2, len(s2), cap(s2))

fmt.Println(s3, len(s3), cap(s3))

}


-------------

[1 2 3 4 5] 5 8

[1 2 3 4 5] 5 8

[1 2 3 4 5] 5 8

[255 2 3 4 5] 5 8

[255 2 3 4 5] 5 8

[255 2 3 4 5] 5 8

使用过 Python 的同学可能会问，切片支持负数的位置么，答案是不支持，下标不可以是负数。

数组变切片

对数组进行切割可以转换成切片，切片将原数组作为内部底层数组。也就是说修改了原数组会影响到新切片，对切片的修改也会影响到原数组。

package main

import "fmt"

func main() {
var a = [10]int{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
var b = a[2:6]

fmt.Println(b)

a[4] = 100

fmt.Println(b)

}


-------

[3 4 5 6]

[3 4 100 6]

Go 语言还内置了一个 copy 函数，用来进行切片的深拷贝。不过其实也没那么深，只是深到底层的数组而已。如果数组里面装的是指针，比如 []*int 类型，那么指针指向的内容还是共享的。

func copy(dst, src []T) int

copy 函数不会因为原切片和目标切片的长度问题而额外分配底层数组的内存，它只负责拷贝数组的内容，从原切片拷贝到目标切片，拷贝的量是原切片和目标切片长度的较小值 —— min(len(src), len(dst))，函数返回的是拷贝的实际长度。我们来看一个例子

package main

import "fmt"

func main() {
var s = make([]int, 5, 8)
for i:=0;i<len(s);i++ {

s[i] = i+1

}

fmt.Println(s)
var d = make([]int, 2, 6)
var n = copy(d, s)

fmt.Println(n, d)

}

-----------

[1 2 3 4 5]
2 [1 2]

当比较短的切片扩容时，系统会多分配 100% 的空间，也就是说分配的数组容量是切片长度的2倍。但切片长度超过1024时，扩容策略调整为多分配 25% 的空间，这是为了避免空间的过多浪费。试试解释下面的运行结果。

s1 := make([]int, 6)

s2 := make([]int, 1024)

s1 = append(s1, 1)

s2 = append(s2, 2)

fmt.Println(len(s1), cap(s1))

fmt.Println(len(s2), cap(s2))

-------------------------------------------
7 12
1025 1344

扩容是一个比较复杂的操作，内部的细节必须通过分析源码才能知晓，不去理解扩容的细节并不会影响到平时的使用，所以关于切片的源码我们后续在高级内容里面再仔细分析。

原文发布时间为： 2018-11-12
本文作者：码洞
本文来自云栖社区合作伙伴“码洞”，了解相关信息可以关注“码洞”。

微信关注我们

原文链接：https://yq.aliyun.com/articles/667927

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

[雪峰磁针石博客]python 3.7极速入门教程7互联网

本文教程目录 7互联网互联网访问 urllib urllib是用于打开URL的Python模块。 import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://china-testing.github.io/address.html') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data) json json是一种受JavaScript对象文字语法启发的轻量级数据交换格式。是目前互联网最流行的数据交换格式。 json公开了标准库marshal和pickle模块的用户所熟悉的API。 >>> import json >>> json.dumps([...

2018-11-12

508

在公众号之前的文章中，已经介绍了在Jupyter Notebook中设置主题以及输出代码文件到pdf文件中，本文来继续介绍jupyter notebook中一些实际的技巧。本次要介绍的两个功能是：（1）针对 jupyter notebook 中的 Markdown 文件自动生成目录（2）自动补全代码上述两个功能，都是有 python的一个 jupyter 扩展插件Nbextensions库来实现。安装该库的命令如下： python -m pip install jupyter_contrib_nbextensions 然后执行： jupyter contrib nbextension install --user --skip-running-check 安装完成后，勾选 “Table of Contents” 以及 “Hinterland”。其中 Hinterland 是用来自动补全代码的，这个拓展的代码补全功能虽然没有 PyCharm中的那么全面，但比没有是要好多了。设置如下：自动补全代码的效果如下：关于 Jupyter Notebook，如果你有一些好的使用技巧...

2018-11-12

663

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。