Java集合 - List介绍及源码解析-低调大师

Java集合 - List介绍及源码解析

2019-04-28 735

Java集合 - List介绍及源码解析
(源码版本为 JDK 8)

集合类在java.util包中，类型大体可以分为3种：Set、List、Map。

JAVA 集合关系（简图）#
集合.jpg

（图片来源网络）

List集合和Set集合都是继承Collection接口，是List和Set的最上级接口，包含如下方法:

Collection接口.png

List 集合#
List是一个有序集合(也称为序列)，你可以控制每个元素被插入的位置，和根据索引访问列表中元素。List集合元素可以重复，也可以存入 null 元素。

List集合是可以根据索引来操纵集合，所以List接口在Collection接口基础增加了一些根据索引操纵集合的接口方法。

List接口.png

集合接口的实现类#
List 集合有两个常用实现，ArrayList和LinkedList，内部采用不同数据结构来实现，不同场景下有不同的使用选择。

ArrayList

ArrayList类-1.png

ArrayList类除了继承和实现集合接口外，还实现了RandomAccess, Cloneable接口。说明ArrayList支持克隆和快速随机访问。

ArrayList 的内部数据结构是数组。

ArrayList内部数据结构-数组.png

默认初始化容量为10

默认初始化容量.png

从查找，增加，删除，修改元素方法看ArrayList集合

查找元素方法：get，indexOf

Copy
// 直接根据索引查找元素，效率较高
public E get(int index) {

rangeCheck(index);
return elementData(index); // 根据索引直接返回数组中元素

}

// 根据元素查索引位置，元素不存在返回 -1 ，使用了循环遍历查找元素，查找效率取决于集合大小，元素所处的位置。
public int indexOf(Object o) {

if (o == null) {
    for (int i = 0; i < size; i++)
        if (elementData[i]==null)
            return i;
} else {
    for (int i = 0; i < size; i++)
        if (o.equals(elementData[i]))
            return i;
}
return -1;

}
增加元素方法：add

Copy
// 增加元素，存在扩容，数据拷贝等问题，效率会变低，如果要向集合中大量的添加元素可以通过构造方法指定较大的初始容量。
public boolean add(E e) {

ensureCapacityInternal(size + 1);  // 增加 modCount!!
elementData[size++] = e;
return true;

}

private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

// 计算容量
private static int calculateCapacity(Object[] elementData, int minCapacity) {

if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
    return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;

}

// 确保容量安全
private void ensureExplicitCapacity(int minCapacity) {

modCount++; // 集合结构修改计数器（结构修改是指那些改变列表的大小或位置等）
// 当所需最小容量比数组容量大需要扩容
if (minCapacity - elementData.length > 0)
    grow(minCapacity);

}

// 扩容
private void grow(int minCapacity) {

// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1); // 容量变为原来的1.5倍
if (newCapacity - minCapacity < 0)
    newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
    newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);

}
删除元素方法：remove

Copy
// 根据索引删除元素，如果从开头和中间位置删除元素，删除位置后面的元素会向前移动，效率会比删除末尾元素低。
public E remove(int index) {

rangeCheck(index);

modCount++;
E oldValue = elementData(index);

int numMoved = size - index - 1;
if (numMoved > 0)
    // 元素的移动拷贝
    System.arraycopy(elementData, index+1, elementData, index,
                     numMoved);
elementData[--size] = null; // 赋值为null 明确的让垃圾回收，--size 删除元素后修改集合长度

return oldValue;

}
Copy
// 根据集合元素删除，先循环找出要删除的元素位置索引，然后再根据索引删除。和根据索引删除方法比较，多了一步通过循环查找元素索引位置的过程。
public boolean remove(Object o) {

if (o == null) {
    for (int index = 0; index < size; index++)
        if (elementData[index] == null) {
            fastRemove(index);
            return true;
        }
} else {
    for (int index = 0; index < size; index++)
        if (o.equals(elementData[index])) {
            fastRemove(index);
            return true;
        }
}
return false;

}

// 删除集合元素
private void fastRemove(int index) {

modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
    System.arraycopy(elementData, index+1, elementData, index,
                     numMoved);
elementData[--size] = null; // clear to let GC do its work

}
修改元素方法：set

Copy
// 根据索引修改元素，直接索引指向新的元素值。
public E set(int index, E element) {

rangeCheck(index);

E oldValue = elementData(index);
elementData[index] = element;
return oldValue;

}

通过上面代码可以发现，ArrayList 集合检索元素效率较高，比较适合，而对于增删效率较低。

LinkedList

LinkedList集合.png

LinkedList 类还实现了Deque 接口（Deque 代表算端队列，与 List 接口不同，此接口不支持通过索引访问元素），所以LinkedList 是一个List集合也是一个双端队列。

LinkedList类-1.png

Copy
private static class Node {

E item; // 当前元素
Node<E> next; // 下一个节点
Node<E> prev; // 上一个节点

Node(Node<E> prev, E element, Node<E> next) {
    this.item = element;
    this.next = next;
    this.prev = prev;
}

}

LinkedList 是一个链表数据结构，其中维护了一个内部类Node做为链表中的节点，first 是指向首节点，last 是指向尾节点。每个Node节点都记录上一个节点、下一个节点的引用，和当前节点所存储的元素。

链表结构如图：

双向链表结构图.png

（图片来源网络）

从查找，增加，删除，修改元素部分方法看LinkedList集合适合哪些操作（从底层数据结构就能够发现）

查找元素方法：get

Copy
// 根据索引查找元素，由于链表没有索引，所以需要从头部或尾部遍历查找。ArrayList 和 LinkedList底层数据结构不同导致的 ArrayList集合中查找元素效率更高，因为ArrayList底层是数组，可以直接根据index索引获取元素。
public E get(int index) {

checkElementIndex(index);
return node(index).item;

}

Node node(int index) {

// 如果要找的元素位置小于集合长度的1/2,就从前向后遍历，否则从后向前遍历，由此可知越向中间效率越低
if (index < (size >> 1)) {
    Node<E> x = first;
    for (int i = 0; i < index; i++)
        x = x.next;
    return x;
} else {
    Node<E> x = last;
    for (int i = size - 1; i > index; i--)
        x = x.prev;
    return x;
}

}
增加元素方法：add

由于底层数据结构不同，LinkedList增加元素效率要比ArrayList效率高，ArrayList存在扩容和拷贝等操作。

Copy
// 向尾部添加元素
public boolean add(E e) {

linkLast(e);
return true;

}

void linkLast(E e) {

final Node<E> l = last;
final Node<E> newNode = new Node<>(l, e, null); // 创建一个新节点
last = newNode; // 将新节点指向尾节点（last）
if (l == null) 
    first = newNode;//  如果newNode是集合中唯一元素（初始是空集合），那么也将newNode指向首节点（first）
else
    l.next = newNode; // 原last节点下一个元素的引用指向新的节点（newNode）
size++;
modCount++;

}

// 在指定位置添加元素，index 位置越靠近中间插入效率越低，随着集合长度增大而增大
public void add(int index, E element) {

checkPositionIndex(index);

if (index == size) // index==size 说明集合为空或者在集合末尾添加元素
    linkLast(element);
else
    linkBefore(element, node(index));

}

// 链表和数组不同，不能直接根据索引获得元素，链表需要从头或尾部循环遍历到指定位置获得元素
Node node(int index) {

// 如果要找的元素位置小于集合长度的1/2,就从前向后遍历，否则从后向前遍历，所以向中间效率越低
if (index < (size >> 1)) {
    Node<E> x = first;
    for (int i = 0; i < index; i++)
        x = x.next;
    return x;
} else {
    Node<E> x = last;
    for (int i = size - 1; i > index; i--)
        x = x.prev;
    return x;
}

}

// 在 succ节点之前插入元素
void linkBefore(E e, Node succ) {

final Node<E> pred = succ.prev; 
final Node<E> newNode = new Node<>(pred, e, succ);// 创建一个新节点
succ.prev = newNode; // 
if (pred == null)
   // 说明 succ 是首节点
    first = newNode;
else
    pred.next = newNode;
size++;
modCount++;

}
修改元素方法：set

LinkedList修改元素时需要先遍历找到元素，ArrayList可以直接根据索引获得元素，所以LinkedList效率较低，当元素越靠近中间位置越明显。

Copy
public E set(int index, E element) {

checkElementIndex(index);
Node<E> x = node(index);
E oldVal = x.item;
x.item = element;
return oldVal;

}

// 根据索引遍历出元素节点
Node node(int index) {

// 如果要找的元素位置小于集合长度的1/2,就从前向后遍历，否则从后向前遍历，所以向中间效率越低

if (index < (size >> 1)) {
    Node<E> x = first;
    for (int i = 0; i < index; i++)
        x = x.next;
    return x;
} else {
    Node<E> x = last;
    for (int i = size - 1; i > index; i--)
        x = x.prev;
    return x;
}

}
删除元素方法：remove

和ArrayList相比不存在移动拷贝情况，所以LinkedList删除元素效率比ArrayList高

Copy
public E remove(int index) {

checkElementIndex(index);
return unlink(node(index));

}

// 根据索引遍历查找出目标节点
Node node(int index) {

// 如果索引小于集合长度的一半
if (index < (size >> 1)) {
    Node<E> x = first;
    for (int i = 0; i < index; i++)
        x = x.next;
    return x;
} else {
    Node<E> x = last;
    for (int i = size - 1; i > index; i--)
        x = x.prev;
    return x;
}

}

E unlink(Node x) {

// assert x != null;
final E element = x.item;
final Node<E> next = x.next;
final Node<E> prev = x.prev;

if (prev == null) {
    first = next;
} else {
    prev.next = next;
    x.prev = null;
}

if (next == null) {
    last = prev;
} else {
    next.prev = prev;
    x.next = null;
}

x.item = null;
size--;
modCount++;
return element;

}
LinkedList 实现了Deque接口，是一个双端队列，所以LinkedList又包含如下常用方法：

Deque接口部分方法.png

源码中“有趣”的设计#
方法重复定义

源码中Collection接口中的多个方法在List接口中又重复定义了一次，既然List 已经继承了Collection接口，为什么重复定义，历史原因？先有List后有Collection？

Collection接口-1.png

List接口-1.png

重复实现接口

AbstractList 已经实现List接口，ArrayList继承 AbstractList，然而ArrayList源码又实现了 List接口。

ArrayList类.png
AbstractListl类.png

网上搜了下答案：
重复实现接口.png

意思是他问过这块的开发者,这是一个错误。很久以前认为有价值的。

不知道这个答案是否正确？

https://stackoverflow.com/questions/2165204/why-does-linkedhashsete-extend-hashsete-and-implement-sete

小结#
List集合和Set集合都是继承Collection接口，Collection是List和Set的最上级接口，List接口下有两个常用的实现类，分别为ArrayList和LinkedList，而LinkedList又实现Deque接口，所以LinkedList即是List集合也是一个双端队列。

ArrayList是基于数组数据结构而实现的，而LinkedList是基于链表数据结构实现的，从数据结构特点和源码实现上来看，ArrayList可以根据索引快速获取到元素，而增加元素时需要数组的扩容和拷贝，删除元素时需要数组的移动拷贝，因此ArrayList集合对查找和修改元素效率较好，对增删效率略低。

LinkedList的链表数据结构不能根据索引直接快速获取元素节点，必须从头部，或者尾部遍历到索引位置（如果索引值小于集合长度的1/2时就从头部开始遍历，否则从尾部开始遍历，因此索引值处于中间时遍历效率会比位于两端要差。）而增加或删除元素时只需要将上下节点重新指向新的节点对象引用即可，不存在扩容，移动等情况，因此LinkedList和ArrayList相比更适合增加和删除元素操作，对查找操作效率较低。

转载请注明出处： https://www.cnblogs.com/newobjectcc/p/10789188.html#

微信关注我们

原文链接：https://yq.aliyun.com/articles/700636

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Python基础面试，看这篇文章画重点吧，Python面试题No1

Python基础面试，看这篇文章画重点吧，Python面试题No1为什么有这个系列的文章一直想写一些更加基础的文章，但是总是想不到好的点子，最近到了就业季，一大堆学生面临就业了，正好，从Python的面试题出发，分析和解答一些常见的面试题，并且总结一些文字。每一讲涉及5~10道面试题，整个系列的文章初步规划有20篇。今天的面试题第1题：1行代码实现1到100的和？分析：这题考察的是对Python内置函数的了解程度 Python常见的内置函数有python内置函数官方查询手册如下https://docs.python.org/3/library/functions.html 图片中我框选的是比较常用的一些，你可能见过，这题考察的是sum也就是求和具体的使用 sum(iterable[, start]) iterable -- 可迭代对象，如：列表、元组、集合。start -- 指定相加的参数，如果没有设置这个值，默认为0。例如 sum([1,2,3]) # 结果为6sum([1,2,3],5) # 结果为11python一行代码如何实现1~100的和还要用到第二个内置函数 rang...

2019-04-28

726

Python3本身支持中文命名类/方法/变量任何额外的库和工具都不需要, 不需要, 不需要! 重要的话三遍. Python3本身就可以正确运行下面的代码: 补一句, 不光是Python3支持中文命名哦, 以后一个一个语言讲过来, 九成九你用的编程语言也支持. 下面是一个Python实用小程序的代码片段: Python3为什么支持非ASCII码命名标识符 Python2并不支持非ASCII码标识符. 于2008年12月发布的Python3开始支持. 2008年! 也就是十多年前, 现在还不知道的话, 你就OUT大了. 创建于2007年5月的Python增强提案PEP 3131 -- Supporting Non-ASCII Identifiers阐述了支持非ASCII码命名标识符的缘由. Rationale (依据) 一节开篇明义, 指出很多Python开发者并不熟悉英语, 更希望用母语对类/方法进行命名, 而不是用经常有误的英文翻译. 对使用同样母语的开发者来说, 用母语命名的标识符可以提高代码清晰度和可维护性. Python code is written by many peop...

2019-04-28

820

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。