上海站源创会精彩回顾
梅俊杰:深度学习 + 大模型,夯实产业智能化基座
孟伟:星云研发大模型,开启编程新范
陈将:向量数据库-AI 时代的信息检索引擎
关于向量数据库为何会成为新一代的信息检索引擎,陈将解释,传统的检索基于关键词匹配的思想来实现,但仅靠关键词匹配往往难以达成我们想要的语义的相近。近年来深度学习的研究发现,可以先通过大量的语料学习来找到词和词之间的关系,句与句之间的关系,通过深度神经网络提取海量语料中的概率信息,再以一个系统的方式去高效地把词句之间的关系“压缩”放进一个模型里面,那么理论上就能通过深度学习来达到“理解”语义的能力。这个方法叫做embedding。采用这种思想,通过各种embedding模型可以对所有非结构化信息进行编码。我们可以将图片、文本转化成数字表示,这个数字表示我们将其称为向量。将向量放到一个高维空间中去看,会发现,向量距离上的相似度可以表征语义相似度。找到这个方法之后,便是找到了一个系统的模式,可以把非结构化信息通过向量的方式进行检索。这个方法的好处就是跳开了关键词匹配的限制,可以查询到关键词匹配不到但是语义相近的信息。那么向量数据库就是为这种查询模式而生的数据库——存储并索引向量,进行高效检索。目前向量数据库已经可以应用到 NLP、图像和视频、多模态等多种检索场景中。
陈将所在的 Zilliz 从向量数据库开始做起,目前也为AI 应用开发者提供了非结构化数据检索产品 Zilliz Cloud Pipelines。Zilliz 坚持以非结构化数据为中心,坚持开源开放和云原生,推出了世界上第一款开源向量数据库Milvus,同时也提供云上的托管版本。
宗升亚:大模型的前世今生
李杨:百度 CloudIDE 及智能化代码开发实践

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
The Next Generation of Apache Flink
摘要:本文整理自阿里云智能 Flink 分布式执行负责人、Apache Flink PMC 成员、Flink 2.0 Release Manager 宋辛童老师在 Flink Forward Asia 2023 主会场的分享。本次分享将介绍 Apache Flink 社区未来一年的主要技术方向及规划,以及 Flink 2.0 版本的筹备情况。 点击查看原文视频 Flink 社区目前正在大力投入且未来也会持续投入的工作主要集中在以下三个方向: 第一个方向,流处理上的极致优化与技术演进。Flink 是实时计算领域的事实标准,但这是一种横向的比较,如果纵向分析,即用 Flink 与自身作比较,在实时计算领域现有的技术是否已经足够成熟?是否足够解决用户在生产中遇到的各种各样的问题?从这个角度看,我们还有提高的空间。Flink 社区也会持续推动流处理技术的优化与演进,以保持项目在业界技术的领先性,同时也带动整个业界流处理技术向前发展。 第二个方向,流批一体架构的演进。从 Flink 社区自 2018、2019 年前后开始大力推广的基于 Flink 的流批一体架构,到现在提出的 Streaming...
-
下一篇
5 款开源热搜项目「GitHub 热点速览」
随着 2023 年的结束,我们也迎来了 2024 年的第一个工作日,新的一年就让「GitHub 热点速递」陪你一起进入工作状态吧! 说到上周的 GitHub 热搜项目就不得不提一下,一周飙升了 8 千 Star 的 PDF 文件处理神器 Stirling-PDF。还有苹果的开源的多模态 LLM,在过去一周悄然收获了 2 千 Star 引人关注。不过,我最喜欢的还是专为程序员打造的随手记事本 heynote,以及一款国人开发的 TikTok 下载神器。 新增的 「开源新闻」 部分,将分享过去一周开源领域的热门新闻,关注最新开源动态、品热搜开源项目。 以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布 | 实用 | 有趣,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知 🌝 本文目录 1. 开源新闻 1.1 GitHub 2023 年热门博文 2. Gi...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- MySQL8.0.19开启GTID主从同步CentOS8
- 面试大杂烩
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7设置SWAP分区,小内存服务器的救世主