每日一博 | 一道快速考察 Python 基础的面试题
这是前一阵子群友发在群里的一道面试题,利用 Python 字典的特性,可以巧妙地使用精简代码达成完美解。
题目
将 data 转换成 new_data 这种形式,写出转换过程。
data = { 'a_b_h':1, 'a_b_i':2, 'a_c_j':3, 'a_d':4, 'a_c_k':5, 'a_e':6 } new_data = { 'a':{ 'b':{ 'h':1, 'i':2 }, 'c':{ 'j':3, 'k':5 }, 'd':4, 'e':6 } }
可以看出,转换的过程是将 key 的下划线进行拆分,然后下划线后边的字符嵌套在前面字符的值中。
感兴趣就打开 IDE,自己先试着解一下。
解题思路
你应该很快想到,主要思路是将下划线 split
后,然后依次使用字符生成内层字典,当达到最后一个字符时将数字作为值。
那么关键点在于,如何不断地获得内层字典去修改呢?实际本题就是考察你是否理解 Python 字典是引用传递这个特性。
什么是引用传递?我们知道 Python 中字典和列表对象都是可变对象,它们的变量传递给另一个变量后,改变对象元素会使得两个变量都会同时改变,比如:
new_data = {} tmp = {} new_data['a'] = tmp print(new_data) # {'a': {}} tmp['b'] = 1 print(new_data) # {'a': {'b': 1}}
如上,利用这个特性,将内层字典赋值给一个中间变量,然后改变这个中间变量,即可同步修改最终的 new_data 变量。
根据这个思路,初步代码如下:
data = { 'a_b_h':1, 'a_b_i':2, 'a_c_j':3, 'a_d':4, 'a_c_k':5, 'a_e':6 } new_data = {} for key, value in data.items(): keys = key.split('_') tmp = new_data last = len(keys) - 1 # 最后一个 key 的索引值 for i, k in enumerate(keys): if i == last: tmp[k] = value continue if k not in tmp: sub_tmp = {} tmp[k] = sub_tmp tmp = sub_tmp else: tmp = tmp[k]
这也是群友给出的第一版答案,这样写并没有多大问题,但是代码比较繁琐,肯定还有优化空间。
我们可以只使用一个中间变量即可,进一步优化:
for field, value in data.items(): keys = field.split('_') tmp = new_data last = len(keys) - 1 for i, k in enumerate(keys): if k not in tmp: tmp[k] = {} if i < last else value tmp = tmp[k] # 将内层 dict 传给 tmp
上面这个代码看似很简洁了,但是仍然还有两个 if 判断,如果不是使用了三元表达式的话,还会更多行。
所以可以进一步优化:
for field, value in data.items(): keys = field.split('_') tmp = new_data for k in keys[:-1]: tmp = tmp.setdefault(k, {}) tmp[keys[-1]] = value
我们省略掉了 last 来判断最后一个字符的索引,直接通过 keys[:-1]
避开最后一个字符,末尾再单独生成数字键值对。
这里还使用字典的一个内置方法 —— setdefault
。
dict.setdefault(key, default=None)
方法和 get
方法类似,只是如果键不存在于字典中,不仅会返回 default 参数的值,还同时会用该值自动生成一个键值对。
if k not in tmp: tmp[k] = {} v = tmp[k] # 等价于 v = tmp.setdefault(k, {})
最终我们使用了 6 行代码就解出该题,这也是接近最简代码。
如果使用字典引用的特性是合格的话,那么当你用出 setdefault
这个方法后,面试官已经给你打了优秀,所以一定要熟悉这些数据对象的所有内置方法。
本文属于原创,首发于微信公众号「面向人生编程」,如需转载请后台留言。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
C++ 20 准备发布,C++ 23 提上议程
根据 Reddit C++ 版块上的信息,C++ 20 已经正式通过委员会草案,这意味着 C++ 20 可以准备发布。 “在近期 ISO C++ 委员会会议上,我们完成了 C++ 20 委员会草案,并投票决定将国际标准草案(DIS,Draft International Standard)发送出去,以进行最终批准和发布”,帖子介绍:“在程序上,DIS 可能会被拒绝,但是由于我们的程序和过程,这种情况极不可能发生。这意味着 C++ 20 已经完成,并将在几个月后发布该标准。” C++ 20 是近十年来影响最大的一个版本,新的特性众多,包括: 模组(Modules) 协程(Coroutines) 标准库 Concepts 的概念 范围(range) constexpr支持:new/delete、dynamic_cast、try/catch、虚拟 constexpr向量和字符串 计时:日历、时区支持 std::format std::span std::jthread 预计这些新特性将会对开发者及 C++ 生态产生不小影响,特别是像协程这种巨大的变化。 同时,在此次会议期间,委员会还通过了 ...
- 下一篇
Firefox 75 添加了图像延迟加载功能
Mozilla将对图像延迟加载(lazy loading)的支持添加到了 Firefox 75中。目前,默认情况下该功能尚未被启用,但用户可以在最新的 Nightly 版本中启用该功能,并可以在延迟加载的演示站点上自行测试该功能。此前,谷歌也曾在Chrome 中为 iframe 和图片启用了延迟加载。 Firefox的最新Nightly 版本已支持 <img loading=”lazy”> Lazyloading 语法。 在 Firefox 中启用图像的延迟加载 1. 启动 Firefox Nightly 浏览器 2. 访问:config 3. 搜索“lazy”,在突出显示的结果中,将dom.image-lazy-loading.enabledpref值更改为true 4.现在,重新启动浏览器,访问 IMG loading lazy demo site,并尝试向下滚动,可以发现猫的图片会一次又一次地加载。 您还可以在顶部看到“HTMLImageElement.prototype”的“loading”值为true,在非 Nightly 版本中,其则显示为 false。 且当您...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8编译安装MySQL8.0.19
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Red5直播服务器,属于Java语言的直播服务器
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题