【Java】容器类总结
容器类库主要分为Collection和Map
Collection
如上图,有List、Set、Queue3个接口继承了Collection接口,分别规定了三种处理数据的方式。
list
列表,只是一个接口,具体的实现方式有ArrayList(数组实现)、LinkedList(链表实现)
特点:需要按照插入的顺序保存元素
set
集合,数学意义上的集合就是无重复,一种接口
特点是元素不重复且无序排列,因为排列是无顺序的,所以没有get方法
hashset:基于HashMap实现,查询速度快,存储元素的次序是随机的,底层使用HashMap保存HashSet中所有元素于key上,value使用一个static final的Object对象标识
TreeSet
将元素存储与红-黑树结构中,存储的结果是有顺序的
即有顺序的不重复的集合
【红黑树】O(log N) 近似平衡的二叉查找树
如果我能保证树高一直为~lgN的话 那么所有查找都能在~lgN次比较中结束,但是在动态插入中保持树的完美平衡要付出的代价太大
选择放松完美平衡的要求确保查找在对数时间内完成
先理解2-3树,红黑树是利用2-结点和一些额外信息(替换3-结点)来表示2-3树,对于任意的2-3树,都可以派生出一颗对应的二叉树
红链接-表示原来在同一个3-结点中
黑链接-表示2-3树的链接,由此理解性质4
1、每一个节点或者着成红色,或者是黑色 2、根是黑色的 3、如果一个节点是红色,那么她的子节点必须是黑色的 4、从一个节点到一个null引用的每一条路径必须包含相同数目的黑色节点
在树的结构发生改变(即发生插入和删除操作时)会破坏条件3、4,需要通过调整使得查找树重新满足红黑树的条件
调整分为:改变颜色和左旋右旋
颜色转换可以将上下的链色改变 左旋右旋改变同一层的键
queue
用得少,略过
Map 一组成对的键值对,允许我们用键来查找值
HashMap
线程不安全
传统的数组链表哈希如果hash桶即数组较小那么链表就太长
于是JDK1.8后引入红黑树,当链表大于8的时候,将后面的数据存在红黑树
红黑树还可以描述成:
⑴红链接均为左链接。
⑵没有任何一个结点同时和两条红链接相连。
⑶该树是完美黑色平衡的,即任意空链接到根结点的路径上的黑链接数量相同。
这里节点之间的连接分为红连接和黑连接,取代了红节点和黑节点的定义(本质是一样的),将之前的黑高度相等定义为了黑连接数相等。更为直观。
而如图所示,其实红黑树的每一步操作都对应了二三树的操作,如果是二节点就是黑连接,三节点的话里面的两个数之间就是红连接。
Hashtable
也是散列表 函数是同步的 线程安全
区别
数据结构
HashMap是支持null键和null值的,而HashTable在遇到null时,会抛出NullPointerException异常。这并不是因为HashTable有什么特殊的实现层面的原因导致不能支持null键和null值,这仅仅是因为HashMap在实现时对null做了特殊处理,将null的hashCode值定为了0,从而将其存放在哈希表的第0个bucket中。
HashMap和HashTable都使用哈希表来存储键值对。在数据结构上是基本相同的,都创建了一个继承自Map.Entry的私有的内部类Entry,每一个Entry对象表示存储在哈希表中的一个键值对。
Entry对象唯一表示一个键值对,有四个属性:
-K key 键对象
-V value 值对象
-int hash 键对象的hash值
-Entry entry 指向链表中下一个Entry对象,可为null,表示当前Entry对象在链表尾部
算法
HashTable默认的初始大小为11,之后每次扩充为原来的2n+1。HashMap默认的初始化大小为16,之后每次扩充为原来的2倍。还有我没列出代码的一点,就是如果在创建时给定了初始化大小,那么HashTable会直接使用你给定的大小,而HashMap会将其扩充为2的幂次方大小。
也就是说HashTable会尽量使用素数、奇数。而HashMap则总是使用2的幂作为哈希表的大小。我们知道当哈希表的大小为素数时,简单的取模哈希的结果会更加均匀(具体证明,见这篇文章),所以单从这一点上看,HashTable的哈希表大小选择,似乎更高明些。但另一方面我们又知道,在取模计算时,如果模数是2的幂,那么我们可以直接使用位运算来得到结果,效率要大大高于做除法。所以从hash计算的效率上,又是HashMap更胜一筹。
所以,事实就是HashMap为了加快hash的速度,将哈希表的大小固定为了2的幂。当然这引入了哈希分布不均匀的问题,所以HashMap为解决这问题,又对hash算法做了一些改动。具体我们来看看,在获取了key对象的hashCode之后,HashTable和HashMap分别是怎样将他们hash到确定的哈希桶(Entry数组位置)中的。
线程安全
HashTable是同步的,HashMap不是,也就是说HashTable在多线程使用的情况下,不需要做额外的同步,而HashMap则不行。那么HashTable是怎么做到的呢?
可以看到,也比较简单,就是公开的方法比如get都使用了synchronized描述符。而遍历视图比如keySet都使用了Collections.synchronizedXXX进行了同步包装。
【synchronized描述符】
synchronized关键字最主要有以下3种应用方式,下面分别介绍
- 修饰实例方法,作用于当前实例加锁,进入同步代码前要获得当前实例的锁
修饰静态方法,作用于当前类对象加锁,进入同步代码前要获得当前类对象的锁
修饰代码块,指定加锁对象,对给定对象加锁,进入同步代码库前要获得给定对象的锁。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
深度学习入门笔记系列 ( 八 ) ——基于 tensorflow 的手写数字的识别(进阶)
基于 tensorflow 的手写数字的识别(进阶) 本系列将分为 8 篇 。本次为第 8 篇 ,基于 tensorflow ,利用卷积神经网络 CNN 进行手写数字识别 。 1.引言 关于 mnist 数据集的介绍和卷积神经网络的笔记在本系列文章中已有过介绍 ,有需要可见下述两篇文章 。本系列第 5 篇曾实现利用最简单的 BP 神经网络进行手写数字识别 。本系列第 6 篇简单介绍了下卷积神经网络的知识 。 基于 tensorflow 的手写数字识别 卷积神经网络(CNN)学习笔记 2.设计的 CNN 结构 本系列第 4 讲讲过实战可以大致分为 "三步走" ● 定义神经网络的结构和前向传播的输出结果 ● 定义损失函数以及选择反向传播优化的算法 ● 生成会话(tf.Session) 并在训练数据上反复运行反向传播优化算法 这里也一样 ,当然首先是设计我们针对此实战的卷积神经网络 ,设计一个最简单的如下手绘 (还是那句话 ,字丑人帅 ,拒绝反驳) 上图得到两次卷积池化结果后 ,将结果展平为 1 维向量 ,即1 *(7*7*64),再连接到十个节点的输出层 。 3.手动干起来 ! 首先 ,需...
- 下一篇
[Python爬虫]通过分析胸罩销售记录 发现了惊人的秘密
打开开发者工具-network,在用户评价页面我们发现浏览器有这样一个请求 通过分析我们发现主要用的参数有三个productId,page,pageSize。后两个为分页参数,productId是每个商品的id,通过这个id去获取商品的评价记录,所以我们只需要知道每个商品的productId就轻而易举的获取评价了。再来分析搜索页面的网页源代码 通过分析我们发现每个商品都在li标签中,而li标签又有一个data-pid属性,这个对应的值就是商品的productId了。 大概了解了整个流程,就可以开始我们的爬虫工作了。 首先我们需要在搜索页面获取商品的id,为下面爬取用户评价提供productId。key_word为搜索的关键字,这里就是【胸罩】 import requestsimport re""" 查询商品id """def find_product_id(key_word): jd_url = 'https://search.jd.com/Search' product_ids = []# 爬前3页的商品for i in range(1,3): param = {'keyword':...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS关闭SELinux安全模块
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Windows10,CentOS7,CentOS8安装Nodejs环境