首页 文章 精选 留言 我的

精选列表

搜索[高并发],共10000篇文章
优秀的个人博客,低调大师

颜值妹子写的一手好代码,还赢得了阿里硅谷游学大奖!

由阿里中间件与天池联合举办的『阿里中间件性能挑战赛』决赛答辩会于8月12日在著名学府清华大学举行。 本次大赛吸引到了来自413所知名高校的学生,以及众多来自业界的工程师,共计1946支队伍,近2500人。大赛为选手们开放了阿里电商业务中最具挑战的双十一实时交易真实场景,以及阿里中间件多项开源产品(JStorm/Tair/RocketMQ)。 大赛历时1个多月,选手们可以通过挑战充分展现自己的技术实力。第二赛季入围TOP10的队伍齐聚现场进行最后的巅峰对决。 ▼ TOP10选手风采墙 ▼ ▼答辩会现场 ▼ 精彩记录 ▼ 《阿里大中台战略揭秘》▼ 阿里中间件掌门人蒋江伟(小邪)分享 ▼ 《在阿里技术平台上创业钉钉》▼ 钉钉CTO朱鴻(一粟)分享 ▼ 大赛评委 - 阿里中间件资深技术专家沈询 ▼ ▼ 大赛评委 - 阿里中间件资深技术专家纪君祥 ▼ ▼ 大赛

优秀的个人博客,低调大师

Milvus 核心组件再升级,主打就是一个低延迟、准确度

熟悉我们的朋友都知道,在 Milvus 和 Zilliz Cloud 中,有一个至关重要的组件——Knowhere。 Knowhere 是什么?如果把向量数据库整体看作漫威银河护卫队宇宙,那么 Knowhere 就是名副其实的总部,它的主要功能是对向量精确搜索其最近邻或通过构建索引进行低延迟、近似的最近邻搜索(ANNS)。 Knowhere 2.x 版本自 2022 年 7 月开始重构,经过多次方案讨论、设计、开发和测试的迭代,终于随着 Milvus 2.3 和各位见面了。对于用户而言,相较于 1.x 版本,Knowhere 2.x 版本提供了更规范的接口以及更丰富的功能,例如支持 GPU 索引、Cosine 相似性类型、ScaNN 索引和 ARM 架构等。对于开发者来说,升级后的 Knowhere 可以更方便地增加新的索引算法,利于后期维护。 接下来我将详细为大家介绍 Knowhere 2.x 的新功能、优化及设计理念。 支持 GPU 索引 Zilliz 一直都非常欢迎外部开发者提出想法和贡献代码,此前,英伟达(Nvidia)公司在 Knowhere 2.x 版本贡献了其向量搜索库 RAFT 中的 GPU_FLAT 和 GPU_IVFPQ 索引。GPU 强劲的算力在一些场景下可以显著地加速索引搜索的过程。相较于 CPU 版本,Milvus 端到端性能在 Nvidia A100 上的吞吐量有了显著提升(SIFT1M 近 70 倍)。GPU 索引详细内容请访问 https://milvus.io/docs/install_standalone-gpu-docker.md。 支持 Cosine 相似性类型 在 Knowhere 1.x 版本上,如果想使用 Cosine 相似性类型,用户需要使用 Inner Product 相似性类型并在插入向量前进行归一化操作,使得其在数学上是等价的。这不仅对于用户有更高理论知识的要求,也增加了使用的成本和接入的难度。 Knowhere 2.x 版本原生支持 Cosine 距离并在库内部自动归一化传入向量并适配对应的索引类型,大大减少了理解成本,提升了用户体验。 支持 ScaNN 索引 Faiss 实现的 ScaNN,又名 FastScan,使用更小的 PQ 编码和相应的指令集可以更为友好地访问 CPU 寄存器,从而使其拥有优秀的索引性能。该索引在 Cohere 数据集,Recall 约 95% 的时候,Milvus 使用 Knowhere 2.x 版本端到端的 QPS 是 IVF_FLAT 的 7 倍,HNSW 的 1.2 倍。 支持 ARM 架构 ARM 架构对比 x86 架构,虽然其性能弱于后者,但因为更简单的设计和指令集,ARM 架构的能效和功耗更低,所以价格更为便宜。在 AWS 云平台相同 CPU 规格,如 1 vCPU,16GB 内存的情况下,ARM 实例比 x86 实例的价格低 15% 左右。Knowhere 2.x 版本支持了 ARM 架构,使得用户可以在此架构上运行和搭建上层服务。 支持 Range Search 最近邻问题包括 K 近邻问题 (KNN) 和范围搜索 (Range Search)。前者解决的问题是给定一个向量集合 X,参数 k 和查询向量 q,索引返回在向量集合 X 中由相似性类型定义的离查询向量 q 最“近”的 k 个向量。范围搜索则不给定参数 k,它需要给定一个范围 (radius),索引返回在向量集合 X 中与查询向量 q 的距离在范围内的所有向量。 Knowhere 2.x 为库中的多个索引提供了范围搜索的功能,例如 HNSW,DiskANN 还有 IVF 系列等。不同于 K 近邻问题,范围搜索返回向量的数目是预先不可知的。这对于结果的返回也提出了更高的要求,试考虑查询范围取查询向量 q 与向量集合 X 中最远向量的距离,结果将尝试返回整个向量集合。对此,Milvus 提供了对查询结果分页的功能,具体可参考 https://milvus.io/docs/within_range.md。 优化过滤查询 在向量查询中,可能存在有部分向量已经被删除的情况。或者在标量与向量的混合查询中,有一部分向量已经被标量查询先行过滤,例如数据库中有日期的标量列,并且用户只希望在满足特定日期的向量中进行查询。在大部分向量被过滤的场景下,Knowhere 2.x 针对 HNSW 的过滤向量查询进行了优化,使其相较于之前版本有至多 6 到 80 倍的性能提升。 优化代码结构和编译 Knowhere 2.x 版本简化了 C++ 类之间的继承关系,减少了函数调用;使用代理模式来规范新索引的接入,使得错误使用的风险更低;重构了 Config 模块,使用起来更为方便快捷;使用 conan 作为包管理工具,简化和加速了编译流程;使用 Folly 中的线程池来获得对于线程更为精准的把控。 支持 MMAP MMAP (Memory Mapping) 将文件或设备映射到内存,即进程的地址空间。一些用户可能数据量较大但苦于没有足够的内存空间放置索引。用户之前可以尝试使用磁盘索引 DiskANN,现在也可以尝试使用 MMAP。用户选择开启后,Milvus 和 Knowhere 2.x 会自动将大文件进行内存映射,从而可以在内存不足的情况下使用大索引数据。 支持从索引获得原始向量 用户在搜索完成后,可能需要通过返回的 ID 取得原始向量,进一步进行定制化的计算或筛选。在之前版本的 Milvus 中,需要通过从例如 S3 或其他远程存储中获得。Knowhere 2.x 版本支持从索引中直接获得原始向量。因为索引本身已经被加载到内存(除 DiskANN 以外),该操作的延时会远低于从 S3 获取。值得注意的是并不是所有索引都支持,例如 IVFPQ 对原始向量进行了量化处理,从而丢失了这一信息。具体索引支持的表格详见 https://github.com/zilliztech/knowhere/releases/tag/v2.2.0。 至此,我们罗列了部分 Knowhere 2.x 重要的新功能和优化。希望本文能帮助大家对此有更为清晰的认识,也欢迎大家在 Knowhere 仓库的 issue https://github.com/zilliztech/knowhere/issues 中提出宝贵的意见和建议。同时,Milvus 2.3 系列解读会持续更新,下一篇的主题是 Milvus 最新的消息队列 NATS,敬请期待! 🌟「寻找 AIGC 时代的 CVP 实践之星」 专题活动即将启动! Zilliz 将联合国内头部大模型厂商一同甄选应用场景, 由双方提供向量数据库与大模型顶级技术专家为用户赋能,一同打磨应用,提升落地效果,赋能业务本身。 如果你的应用也适合 CVP 框架,且正为应用落地和实际效果发愁,可直接申请参与活动,获得最专业的帮助和指导!联系邮箱为 business@zilliz.com。 ​ 如果在使用 Milvus 或 Zilliz 产品有任何问题,可添加小助手微信 “zilliz-tech” 加入交流群。 ​ 欢迎关注微信公众号“Zilliz”,了解最新资讯。

优秀的个人博客,低调大师

运营商2月数据:联通5G业务迎来光时刻

昨日,三大运营商公布了其二月份的运营数据。经过近一年的韬光养晦,中国联通首次在月报中公布其5G套餐用户数据。 数据显示,中国联通5G套餐用户2月净增658.9万户,比同期另外两家的净增数据还要多,用户总数量累计达到了8454.3万户。中国联通的5G套餐用户总数在运营商当中虽然不是最高的,也不是增长最快的,但综合中国联通的以往表现,此次也可以说是打了一个“翻身仗”。 5G用户:移动失意,电信联通厚积薄发 在进入5G时代之后,运营商传统业务的竞争格局已经趋于稳定,很难有大的突破和颠覆。 数据显示,2月份,中国移动的移动客户数净减369.2万户,用户总数达到9.37169亿户。今年1月,中国移动的移动用户同样也是负增长(-105万);中国移动4G客户数净增170.7万户,累计达到7.81333亿户。值得注意的是,2月份,中国联通也不再公布其4G用户,也就是说,三大运营商当中,公布4G用户的只剩下中国移动一家。宽带用户方面,中国移动有线宽带客户数净增201.3万户,累计达到2.157亿户。 2月份,中国电信继续稳扎稳打。移动用户持续正增长,上月净增25万户,移动用户数累计达到3.5280亿户。当月,中国电信有线宽带用户数净增56万户,有线宽带累计用户数1.6043亿户。 2月份,中国联通的月度报告有了很大的调整,首次公布了5G套餐用户数,并取消4G用户的披露。数据显示,在移动业务方面,中国联通移动出账用户2月净减2.0万户,累计达3.06亿户。在固网业务方面,中国联通固网宽带用户2月净增25.6万户,累计达8716.3万户; 在最为激烈的5G用户上,中国联通不鸣则已,一鸣惊人。2月份,以净增658.9万户的成绩排在移动和电信之前,5G套餐用户总数累计达到8454.3万户。作为联通共建共享的好伙伴,中国电信2月份的表现也同样不俗,5G套餐用户净增620万户,5G套餐用户总数突破一亿户(1.0337亿)。2月份中国移动的5G业务相对逊色,套餐客户数净增419.7万户,但总数仍然是运营商之首(1.68971亿)。 行业共识:持续挖掘5G价值 5G被视为运营商下一阶段表现的晴雨表。有分析认为,5G时代,运营商的ARPU将得到提升,从而带动移动业务收入和利润重新进入增长轨道;同时行业空间广阔;除了收入端的增长潜力及收入来源的切换,三家运营商成本端的压力也有望得到缓解。 在2020年财报中,中国电信表示2021年4G支出同比大幅减少,不再采购主设备,并进一步利用现有资源,而5G投入将保持稳定。中国联通则表示将持续推进2G精简,力争2021年完成2G公众用户退网;通过网业协同推进,加速2G公众用户向4/5G迁转。 5G背景下,三大运营商已经陆续表态,不再打套餐价格战。目前三大运营商所推出的5G套餐产品套内流量及通话内容基本一致。不打价格战,运营商便可以把更多的心思投入到网络的建设之中,更好地为用户服务。 在5G网络建设过程中,中国电信与中国联通联合建成了全球规模最大的共建共享网络,实现了成本节约和效率提升,成为全球共建共享的成功典范。在2021 MWC上海展开幕式上,中国电信董事长柯瑞文曾表示,针对5G网络巨大的建设和运营成本,将积极尝试多领域的共建共享,降本增效。 有机构预测,2021年5G网络建设与产业规模将进一步增长,预计2021年,电信运营商将继续保持网络大规模部署增速,5G基站新建数量将超过2020年总量,总数达到150万个。2021年,四大电信运营商5G网络投资力度,预计将是2020年的1.5到2倍,5G通信产业规模将超过5000亿元,较2020年增长约150%。

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

用户登录
用户注册