gj6 深入python的set和dict-低调大师

gj6 深入python的set和dict

2021-06-01 569

6.1 collections中的abc

from collections.abc import Mapping, MutableMapping
#dict属于mapping类型

a = {}
print (isinstance(a, MutableMapping))
# True

6.2 dict的常见用法

a = {"lewen1": {"company": "imooc"},
     "lewen2": {"company": "imooc2"}
     }
# clear   Remove all items from D.
# a.clear()
# pass

# copy, 返回浅拷贝
new_dict = a.copy()
new_dict["lewen1"]["company"] = "imooc3"  # 浅拷贝，只是拷贝了指向。这里修改会修改了a 中原来的值
print(new_dict)
print(a)

---
{'lewen1': {'company': 'imooc3'}, 'lewen2': {'company': 'imooc2'}}
{'lewen1': {'company': 'imooc3'}, 'lewen2': {'company': 'imooc2'}}

---

import copy
a = {"lewen1": {"company": "imooc"},
     "lewen2": {"company": "imooc2"}
     }
new_dict = copy.deepcopy(a)               # 深拷贝，开辟独立的内存空间，并复制值
new_dict["lewen1"]["company"] = "imooc3"  # 这里修改，并不会影响字典a的值
print(new_dict)
print(a)

---
{'lewen1': {'company': 'imooc3'}, 'lewen2': {'company': 'imooc2'}}
{'lewen1': {'company': 'imooc'}, 'lewen2': {'company': 'imooc2'}}

---

# formkeys
new_list = ["lewen1", "lewen2"]
new_dict = dict.fromkeys(new_list, {"company": "imooc"})
print(new_dict)

# new_dict["kevin"]  # KeyError 不存在会抛异常
ret = new_dict.get("kevin","None") # 
print(ret)

# items 方法
for key,value in new_dict.items():
    print(key,value)

ret_set = new_dict.setdefault("kevin","new mem")  # 不存在key,就设置并返回值
print(ret_set)
print(new_dict)

new_dict.update(      # update（） 括号里面添加为可迭代对象
    (("lewen", "imooc"),)
    )
---
{'lewen1': {'company': 'imooc'}, 'lewen2': {'company': 'imooc'}}
None
lewen1 {'company': 'imooc'}
lewen2 {'company': 'imooc'}
new mem
{'lewen1': {'company': 'imooc'}, 'lewen2': {'company': 'imooc'}, 'kevin': 'new mem'}

6.3 dict的子类

#不建议继承list和dict
class Mydict(dict):
    def __setitem__(self, key, value):
        super().__setitem__(key, value*2)

my_dict = Mydict(one=1)   # value*2 没有生效
# my_dict["one"] = 1      # 生效了
print (my_dict)
{'one': 1}

---

from collections import UserDict
class Mydict(UserDict):
    def __setitem__(self, key, value):
        super().__setitem__(key, value*2)

my_dict = Mydict(one=1)
# my_dict["one"] = 1
print (my_dict)
{'one': 2}

---

# defaultdict 
from collections import defaultdict

my_dict = defaultdict(dict)
my_value = my_dict["bobby"]  # 没有则返回空字典
print(my_value)
{}

6.4 set和frozenset

#set 集合 fronzenset (不可变集合) 无序， 不重复
s = set('abcdee')
print(s)

s2 = set(['a','b','c','d','e'])
print(s2)

s3 = {'a','b', 'c'}
print(type(s3))

s = frozenset("abcde") #frozenset 不可变，以作为dict的key
                       # 不能添加值
print(s)
# ---
{'a', 'e', 'c', 'd', 'b'}
{'a', 'e', 'c', 'd', 'b'}
<class 'set'>
frozenset({'a', 'e', 'c', 'd', 'b'})

# ---

#向set添加数据
s = set('abcdee')
another_set = set("cef")
s.update(another_set)
print(s)

re_set = s.difference(another_set)  # {'b', 'd', 'a'}
re_set = s - another_set            # {'b', 'd', 'a'}
re_set = s & another_set            # {'c', 'f', 'e'}
re_set = s | another_set              # {'a', 'f', 'c', 'e', 'd', 'b'}

#set性能很高
# | & -  #集合运算
print(re_set)

print (s.issubset(re_set))
if "c" in re_set:
    print ("i am in set")
# ---
{'a', 'f', 'e', 'c', 'd', 'b'}
{'a', 'f', 'c', 'e', 'd', 'b'}
True
i am in set

6.5 dict和set实现原理

from random import randint


def load_list_data(total_nums, target_nums):
    """
    从文件中读取数据，以list的方式返回
    :param total_nums: 读取的数量
    :param target_nums: 需要查询的数据的数量
    """
    all_data = []
    target_data = []
    file_name = "D:\电子书\Python面试宝典Version8.1.pdf"
    with open(file_name, encoding="utf8", mode="r") as f_open:
        for count, line in enumerate(f_open):
            if count < total_nums:
                all_data.append(line)
            else:
                break

    for x in range(target_nums):
        random_index = randint(0, total_nums)
        if all_data[random_index] not in target_data:
            target_data.append(all_data[random_index])
            if len(target_data) == target_nums:
                break

    return all_data, target_data

def load_dict_data(total_nums, target_nums):
    """
    从文件中读取数据，以dict的方式返回
    :param total_nums: 读取的数量
    :param target_nums: 需要查询的数据的数量
    """
    all_data = {}
    target_data = []
    file_name = "D:\电子书\Python面试宝典Version8.1.pdf"
    with open(file_name, encoding="utf8", mode="r") as f_open:
        for count, line in enumerate(f_open):
            if count < total_nums:
                all_data[line] = 0
            else:
                break
    all_data_list = list(all_data)
    for x in range(target_nums):
        random_index = randint(0, total_nums-1)
        if all_data_list[random_index] not in target_data:
            target_data.append(all_data_list[random_index])
            if len(target_data) == target_nums:
                break

    return all_data, target_data


def find_test(all_data, target_data):
    #测试运行时间
    test_times = 100
    total_times = 0
    import time
    for i in range(test_times):
        find = 0
        start_time = time.time()
        for data in target_data:
            if data in all_data:
                find += 1
        last_time = time.time() - start_time
        total_times += last_time
    return total_times/test_times


if __name__ == "__main__":
    # all_data, target_data = load_list_data(10000, 1000)
    # all_data, target_data = load_list_data(100000, 1000)
    # all_data, target_data = load_list_data(1000000, 1000)


    # all_data, target_data = load_dict_data(10000, 1000)
    # all_data, target_data = load_dict_data(100000, 1000)
    # all_data, target_data = load_dict_data(1000000, 1000)
    all_data, target_data = load_dict_data(2000000, 1000)
    last_time = find_test(all_data, target_data)

view

    #dict查找的性能远远大于list
    #在list中随着list数据的增大 查找时间会增大
    #在dict中查找元素不会随着dict的增大而增大
    print(last_time)

#1.dict的key或者set的值 都必须是可以hash的
#不可变对象 都是可hash的， str， fronzenset， tuple，自己实现的类 __hash__
#2. dict的内存花销大（有大量空余的表元），但是查询速度快， 自定义的对象 或者python内部的对象都是用dict包装的
# 3. dict的存储顺序和元素添加顺序有关
# 4. 添加数据有可能改变已有数据的顺序

哈希冲突后重新计算位置

在剩余空间小于三分之一时，申请更大的空间，然后数据搬迁，有可能会改变顺序

微信关注我们

原文链接：https://blog.51cto.com/wenyule/2838779

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

大数据左膀右臂之ZooKeeper超强会话

本文章转自：乐字节文章主要讲解：ZooKeeper会话获取ZooKeeper视频教程及源码文档可以关注公众号《乐字节》发送：999 一、客户端会话的秘密会话，即 session，这个词语或者说概念很多地方都有用到，在 ZK 中会话指的是两个不同的机器建立了网络连接后，就可以说他们之间创建了一个会话。ZK 的会话是有超时的概念的，当会话超时后，会由服务端主动关闭，当然客户端也可以主动请求服务端想要关闭会话。你可能会问，为什么要搞这个麻烦，直接两边连上一直用不就好了吗？有了会话这个概念就是为了防止，在建立连接后，有些客户端不常使用，早点关闭连接可以节省资源。 1.1 鸡太美的一天我发现我好久没有 cue 鸡太美了，这次就让他再 C 位出道一次吧。我们的鸡太美每天起床后，日常发微博、直播、跳舞、打篮球，很多事务都需要去办事处办理。所以第一件事情就是去办事处找马果果（现在就假设马果果一个办事处）申请使用办事处（建立连接，创建会话）而马果果会为鸡太美创建一个 ID，就是会话 ID，这个 ID （我这里假设是 19980802）和鸡太美会进行绑定，而鸡太美在申请的同时还需要告诉马...

2021-06-01

622

前言 go-zero 群里经常有同学问：服务监控是通过什么算法实现的？滑动窗口是怎么工作的？能否讲讲这块的原理？熔断算法是怎么设计的？为啥没有半开半闭状态呢？本篇文章，来分析一下 go-zero 中指标统计背后的实现算法和逻辑。指标怎么统计这个我们直接看 breaker ： type googleBreaker struct { k float64 stat *collection.RollingWindow proba *mathx.Proba } go-zero 中默认的 breaker 是以 google SRE 做为实现蓝本。当 breaker 在拦截请求过程中，会记录当前这类请求的成功/失败率： func (b *googleBreaker) doReq(req func() error, fallback func(err error) error, acceptable Acceptable) error { ... // 执行实际请求函数 err := req() if acceptable(err) { // 实际执行：b.stat.Add(1) // ...

2021-06-01

497

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。