RAG 五周年,向量检索发展状况如何?
AI 一天,人间一年。ChatGPT发布不过才两年多时间,业内就已经从卷大模型训练,上升到了卷AI 应用。到了应用这一层,大模型固有的幻觉问题、知识时效性不足以及垂直领域知识匮乏等缺陷逐渐暴露。大家发现,原来大模型并不是万能的。
在追求更可靠 AI 落地的过程中,RAG(检索增强生成)技术及其核心的向量检索技术,正成为解决这些难题的重要突破口。
基于这一背景,在 RAG 发布五周年之际,开源中国 OSChina《数智漫谈》直播栏目,特别策划"向量检索技术深度解析"专场,邀请到 Shopee 资深算法专家,高性能检索算法 NSG、SSG 发明者傅聪,以及 DolphinDB 研发副总监胡津铭,于 5 月 28 日(周三)19:00,共同解构向量检索的技术本质,探讨其在 AI 时代破局大模型应用困境的核心价值。
本次直播的主讲人傅聪,于浙江大学计算机博士毕业,曾赴美国南加州大学访问研究,其主导发明的 NSG、SSG、PSP、MAG 等高性能检索算法,已落地为千亿级向量检索系统,成为工业界大规模检索的标杆方案。
其中,基于图的高维向量检索算法 NSG,是当前最为先进的图算法之一,与另一算法 HNSW 齐名。NSG 被 Meta 的 FAISS 框架深度集成,实现在低密度连接的节点网络中进行高效的邻近搜索,既提升了搜索速度,又避免了多层结构带来的复杂性;同时该算法也被阿里中台应用于淘宝推荐、图像搜索等核心场景,通过高效处理单机十亿级高维向量数据,显著降低了计算复杂度与响应延迟。
在学术领域,傅聪持续保持高产输出。在 TPAMI、KDD、VLDB、SIGIR、IJCAI、EMNLP、CIKM 等顶级会议或期刊发表论文二十余篇。同时,长期担任 Tpami、TKDE、ICLR、KDD、SIGIR、AAAI、IJCAI、EMNLP 等国际会议审稿人。
此外,他还出版了专著《业务驱动的推荐系统:方法与实践》。该书从业务视角出发,描绘了当下主流推荐系统的设计思想和架构全貌,重点突出系统每个模块所需要解决的问题,进而介绍一到两种实践检验普遍有效、在学术界具备里程碑性质的算法。
目前,傅聪在 Shopee(新加坡) 担任资深算法专家,仍然专注于AI大规模应用落地方面的研究,仅今年上半年,就有 4 篇学术论文通过同行评议,被计算机领域顶级国际会议接收。
本次直播主持人胡津铭,与傅聪师出同门,2020 年毕业于浙江大学计算机学院,曾在 Google、Optiver 等知名企业工作,现为 DolphinDB 智臾科技研发副总监。以 ID “胡津铭” 活跃于知乎,粉丝数量超过 5 万。
我们期待,在胡津铭与傅聪的这场关于“向量检索技术本质与产业实践"的深度对话下,能够让大家对向量检索这一技术有所了解,打开通向下一代 AI 系统的大门。
微信扫码,预约直播,立即获取:
- 大模型幻觉与 RAG、向量检索技术
- 向量检索算法类别、历史沿革、适用场景
- LLM/RAG/Agentic System新宠:图算法
- 向量检索未来十年发展以及工业落地建议
- 开箱即用的向量数据库/向量检索库推荐
【数智漫谈】
OSCHINA 视频号直播畅聊栏目【数智漫谈】,每期一个技术话题,三五位专家围坐,各抒己见,畅聊开源。给大家带来最新的行业前沿、最热门的技术话题、最有趣的开源项目、最犀利的思想交锋。如果你手上也有新点子、好项目,想要跟同行交流分享,欢迎联系我们,讲坛随时开放~

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
AI生成功能设计用例|得物技术
一、AI背景 人工智能生成内容(AIGC,AI-Generated Content)技术的快速发展正在改变内容生产的方式,并逐渐渗透到各个行业,例如:在自媒体平台自动编写文案并发布,快速分析数据,写小说,画漫画等。强大的文本生成能力已经实现了生产力超过生产资料,提供了更加高效的生产力,将AI引入到工作中成为发展的方向。 目前公司编写测试用例为人工编写,存在手工编写用例的普遍痛点,例如:重新编写,费时费力,边界遗漏,兼容遗漏等。AI拥有自动生成文本并快速整合的能力,以AI辅助功能用例编写成为推动行业创新和效率提升的关键点。 AI编写用例的优点: ※ 效率提升 AI可以快速生成大量测试用例,显著减少人工编写所需的时间,提升整体测试效率。 ※ 测试覆盖提升 AI能够自动识别潜在的测试场景和边界条件,从而提高测试覆盖率,确保更全面的检测。 ※ 一致性和准确性提升 AI生成测试用例具有较高的一致性和易理解性,减少人为错误,增强测试的可靠性和准确性。 AI热词: 二、设计方案 本部分介绍使用AI编写测试用例的的设计方案,包括使用流程和架构图。 AI编写用例流程图 AI编写用例架构图 三、设计核心介...
- 下一篇
深入浅出DDD:从理论到落地的关键
随着互联业务的发展、业务逐渐的复杂,传统代码架构在日常开发中存在的多种弊端,如代码混乱、补丁式开发、迭代成本高等问题,大大影响了迭代的效率。本文作者借助 DDD 的战略设计和战术设计,介绍了如何通过限界上下文、领域模型、聚合、资源库等概念,实现业务逻辑与技术的解耦,提升代码的可维护性、扩展性和稳定性。同时,文章作者结合团队在落地DDD时,遇到的卡点、痛点,创新性的提出一种 DDD 的分层实践,并在实际开发中取得了较好的效果 01 背景 不知不觉从事To B业务已经3年,笔者在工作中看了很多、也写了很多的代码,由此也产生很多的思考和感悟:在日常的工作中,我们的主要矛盾在于日渐复杂、动态变化的业务诉求与有限的人力之间的矛盾。而为了解决这一矛盾,我们要尽可能的保证代码的优雅。 但是传统的代码设计,如:面条式代码架构、基于面向对象+MVC的代码架构,大部分无法保证在日趋复杂的业务中以优雅的代码架构持续发展。一旦迭代时间拉长,这类代码往往会或多或少地表现出以下特征: 代码组织混乱(数据的获取随意、业务逻辑与数据逻辑纠缠、结构随意); 业务逻辑透传数据数据库(业务逻辑层层透传到数据库层); 隐式代...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Hadoop3单机部署,实现最简伪集群
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS7设置SWAP分区,小内存服务器的救世主
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7