工程师忽略的隐形成本-低调大师

工程师忽略的隐形成本

2017-07-31 753

有时候我们说，“实现这个功能，我只花了几个小时”。但是完成之后，我们发现每隔几周，我们要么在修复该功能的bug、向另一个工程师解释，要么做客服回答问题、以解释其工作原理。维护该功能总的投入时间要远远超过最初开发的几个小时。

软件开发中内化的最艰难教训之一就是额外复杂度所带来的隐形成本。有时候，复杂度在问题领域只是固有的。为了匹配乘客和司机，通过调整价格来平衡供求是一个复杂和痛苦的问题。因此，在扩大一个社区和维护社区质量的时候，把问题和答案疏通到喜欢回答和看问题的人们那里，也是如此。或者像是开发一个兼容所有设备的富文档编辑器以支持实时协作。这是固有的复杂度，我们需要根据产品做出调整以取得成功。

但是其它时候，和我们较劲的复杂度恰恰是我们自己产生的复杂度。我们用新编程语言写代码，很少人了解它，现在我们不得不维护它。或者我们增加了额外的基础架构，因为我们尝试从Hacker News看到的、热门新技术，但是它失败了，这是我们当初没有想到的。或者我们引入了一个很少人使用的功能，但是修复和bug报告就花掉了极不对称的大把时间。

额外的复杂度暴露了很多隐形成本。在开发软件时，我们所做的决定不只是决定了我们当前的开发速度。它们还要反映出我们花在维护上的时间和努力程度。

复杂度的隐形成本

太多复杂度增加了认知负荷，并产生了做完事情的额外阻力。它以很多不同的方式渗入到团队里——大部分是直接渗入到代码、系统和产品复杂度里，但是间接地渗入到了组织的复杂度里。我们逐个看看这几种不同类型复杂度的隐形成本。

代码复杂度

代码复杂度不只是随着代码行数的线性函数而增长——它组合式地增长。在复杂的代码库里，每行代码可能与其它很多行代码交互和影响。我们对于组合式增长难以有足够的认识，这就是为什么我们倾向于严重低估完成大型软件项目所需要的时间。这也是重写项目有时候会大幅延期的主要原因。

当代码过于复杂的时候，它将变得难以扩展、难以理清其中缘由、难以修复bug，很难理清追踪错误来源的依赖和数据流向。工程师或许会积极地避免代码库最复杂的部分，即使它是可以做某种修改的、最有逻辑的地方，也要选择绕弯来解决。他们或许避免把那些地方都组合起来，即使这项工作有着很大的影响。

系统复杂度

工程师喜欢摆弄新玩具，要么因为好奇，要么因为他们认为新技术可能为解决他们的紧迫问题提供了银弹。当Pinterest在2011年刚开始扩容网站以应对快速增长时，他们只有3个工程师的后端小组却使用了6种不同的存储技术（MySQL、Cassandra、Membase、Memcache、Redis和MongoDB）。他们实验每项新技术的诺言都是解决现有系统的某些限制。但是，每种新解决方案都以其自身特定方式失败了，为了管理和维护而投入了更多时间和努力。最终，团队明白了，增加更多机器而不是更多技术，更能简化扩容，因此他们消除了Cassandra和MongoDB之类的系统，强化了架构的已有组件。

把基础架构切分为太多系统，会带来很多隐形成本。注意力被分散到了多个系统。对于每个系统来说，更难以整合资源以开发可复用的资源库，更难以为日常工作招聘新人，更难以理解具体的失败模式和每个系统的性能特点。每个系统的抽象最终变得更弱，因为没有可投入的太多时间。当工具和抽象太复杂、或太多的时候，让团队去理解和探索将变得困难。

产品复杂度

产品复杂度可以导致一个不明确的版本、或引发缺乏产品聚焦的无节制野心。它希望在很多地方是优秀的，而不只是在一个核心领域，这种欲望使其不能向新用户明确地解释产品的意图。产品复杂度引发了更多的代码和系统复杂度——团队增加更多代码、更多基础架构以支持新功能。当产品外围宽泛时，增加一个新功能或修改现有功能，将需要放大很多的努力来理解和适应旧的功能。

过于复杂的产品意味着有更多的代码分支，更多要考虑的问题、更多的需要团队解决的bug反馈。工程师和数据科学家需要分析更多的变量、做更多的一次性的报表，而不是集中于核心用户行为的理解上。工程师需要投入更多时间来提供功能空间和提高效率。每个人最终在更多的项目中进行切换。投入在维护所有这些功能上的时间，并不是重新投入代码、偿还技术债务、加固抽象的时间。

组织的复杂度

代码、系统和产品复杂度，依次产生了组织的复杂度。团队需要雇佣更多人来处理和维护已开发的所有东西。越大的团队意味着越多的沟通成本、越多的协调和和越低的总体效率。招聘过程本身，涉及的所有面试和汇报，消耗了团队很大比例的时间。当然，所有新员工不得不被培训才能上岗。

雇佣更多人的替代方法，就是将工程师组成划分成更小的团队——或许甚至创建了一人小组——来承担较多代码、系统和产品外围的工作。这降低了沟通成本，但是一人小组有他们自己的成本。一旦遇到难题，就完全拖延了项目中的唯一人手，因为有更少的人来分享这些低谷期，这种体验对于士气是有害的。与其他人合作的机会少了，会伤害到工作场所的快乐和员工的留任。除非每个人比较自觉，而且主动询问反馈，否则个人收到的工作反馈将更少，因为分享相同项目上下文的人更少了。减少的反馈能够降低代码质量、或因疏忽导致的复杂度引入到代码库或基础架构里。

如何应付复杂度

Tony Hoare在1980年图灵奖的演讲中建议，“构造软件设计有两种方法：一种是简单，明显地没有缺陷；另一种方法是使其复杂，却没有明显的缺陷。”提到了由于复杂度而导致的非明显的缺陷是如何伤害我们的，以及我们该如何应对这些成本？

下面是你能够用到的一些策略：

为简单而优化。抵制增加更多复杂的主张。深思维护成本。要自问，为了解决20%的问题而引入的复杂是否值得，或者80%的解决方案已经足够了。
为你的团队或产品定义一种任务说明以统一思想。在Team Geek，Brian W. Fitzpatric和Ben Collins-Sussman解释了他们是如何辅导Google Web Toolkit（GWT）团队、并鼓励他们写下任务说明的。接下来发生的、对于任务说明的内容和形式的争论，表明了首席工程师并不真正认同产品方向！他们被迫面对、协调不同、并最终达成了，“GWT的任务是为用户彻底提升web体验，让开发者使用现有的Java工具在任意现代浏览器里构建高性能的AJAX。”如果他们不能尽早找出这些区别，随之而来的努力上的分散又有多少呢？
用较小的构建块组成大型系统。Google就是个例子，致力于构建健壮的核心抽象，然后被非常宽泛的应用程序广为使用。他们有基础的构建块，像Protocol Buffers、Google File System和远程程序调用的Stubby服务器。基于这些构建块之上，他们还建立了其它抽象，比如MapReduce和BigTable。在此之上，包括大型web索引、Google Analytics站点追踪、Google News聚合、Google Earth数据处理、Google Zeitgeist数据分析在内的数以千计的应用程序，还有很多程序都是这样构建的。
清晰地定义模块和服务之间的接口。模块和服务的退耦，将减少能够产生一堆代码的组合复杂度。在Amazon，Jeff Bezos于2002年宣称，公司将转向面向服务的架构，所有团队只能通过服务层级的接口彼此交流。虽然这个转变造成了本身巨大的开发成本，但是它强制分离了代码和服务背后的逻辑，为现在极度成功的Amazon Web Services的建立提供了便利。
优先偿还技术债务。我们总是在信息不完全的条件下开发软件。做为条件变化的响应，代码库在增大，熵也在增大。增加的复杂度成为了未来开发的代价。在开发日常上预算时间可以减少这项成本。很多工程师和团队在项目之间预算这项时间，不过召开一次性的会议会有帮助。我过去在Quora组织过一次Code Purge Day（代码消除日）活动，工程师在这一天全部关注删除无用代码的工作。我们在积分牌上追踪代码消除的进度，这使得删除你自己的代码更有趣味。
使用数据修剪没用的功能。在Yammer，当工程师或产品经理发现在代码重构时，强化或保留一个功能将花费不菲的时间时，他们将查看使用数据，以确定这项功能是否真正被使用了。如果没有，他们将和团队一起决定，他们是否应该只是砍掉这个功能以降低总体工作量。与简化的代码是怎样减少技术债务一样，这个策略也减少了技术债务。
基于主题对进行中的项目分组。使同事彼此分享同样的环境，更容易地参与到设计讨论、代码评审或构建可复用的资源库。所有这些活动有助于提供检查和平衡掉单个人或其他人所引发的问题。

当我们为学校课程开发软件时，我们有着世界的过于简单的视角——维护任意复杂度的成本随着下课而消失了。但是在我们的职业生涯中，糟糕的软件决定将产生数年负担的影响。

不要使事情复杂化。

作者：腊八粥

来源：51CTO

微信关注我们

原文链接：https://yq.aliyun.com/articles/203658

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

基于java的分布式爬虫

分类分布式网络爬虫包含多个爬虫，每个爬虫需要完成的任务和单个的爬行器类似，它们从互联网上下载网页，并把网页保存在本地的磁盘，从中抽取URL并沿着这些URL的指向继续爬行。由于并行爬行器需要分割下载任务，可能爬虫会将自己抽取的URL发送给其他爬虫。这些爬虫可能分布在同一个局域网之中，或者分散在不同的地理位置。根据爬虫的分散程度不同，可以把分布式爬行器分成以下两大类： 1、基于局域网分布式网络爬虫：这种分布式爬行器的所有爬虫在同一个局域网里运行，通过高速的网络连接相互通信。这些爬虫通过同一个网络去访问外部互联网，下载网页，所有的网络负载都集中在他们所在的那个局域网的出口上。由于局域网的带宽较高，爬虫之间的通信的效率能够得到保证；但是网络出口的总带宽上限是固定的，爬虫的数量会受到局域网出口带宽的限制。 2、基于广域网分布式网络爬虫：当并行爬行器的爬虫分别运行在不同地理位置（或网络位置），我们称这种并行爬行器为分布式爬行器。例如，分布式爬行器的爬虫可能位于中国，日本，和美国，分别负责下载这三地的网页；或者位于CHINANET，CERNET，CEINET，分别负责下载这三个网络的中...

2017-07-31

618

关于软件定义安全的担忧是真实的。SDN用户对其的担忧直逼网络漏洞，也许更甚，原因不外乎：a.他们正在为其网更改新的规则;b.他们采用的是相对较新的技术。当发现安全问题需要修复时，他们得费心思更新系统和打补丁。很多网络管理员在其现有基础设施上进行安全修复工作进展相当缓慢。如果他们采用的是经典的SDN(即网络控制和网络数据包处理相分离)，他们要对控制器和数据平台设备以及所有控制器上的SDN应用进行更新。如果采用的是以虚拟化为主的SDN，他们也得关注控制器，同时也要看护底层的虚拟化平台以及带有自己操作系统的混合的物理设备。在这两种场景中，鉴于管理员正在改变其控制和架构网络、安全的方式，网络团队需要确保其监控工具能跟踪到最新情势。如果虚拟叠加网络创建新的安全区域，安全操作中心应该可以监测到并根据需求报告那些区域内外的活动。人们需要时刻准备着以迎接SDN技术带来的网络攻击问题。例如，一些新的类别的耗尽资源式拒绝服务攻击很可能基于SDN控制器的使用。所有企业都应该准备好投入到新型缓解和防护技术中来。作者：John Burke 来源：51CTO

2017-07-31

658

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。