开源中国发布大模型技术图谱(LLM Tech Map)
LLM 技术图谱 (LLM Tech Map) 是将 LLM 相关技术进行系统化和图形化的呈现,此图谱主要特点是“专注于技术人视角”,不求从 LLM 产业角度汇聚信息,而是希望让从事相关工作或是想了解 LLM 的技术人有一个快速感知。
核心价值:帮助技术人快速了解 LLM 的核心技术和关键方向。
LLM 技术图谱(LLM Tech Map)从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。
基础设施
LLM 技术图谱(LLM Tech Map)的基础设施部分主要包括以下几个方面:
- 向量数据库:向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。
- 数据库向量支持:传统数据库通常不支持向量数据的存储和检索,数据库向量支持可以为传统数据库添加向量数据的存储和检索能力。
- 大模型框架、微调 (Fine Tuning):针对大模型的开发。
- 大模型训练平台与工具
大模型
LLM 技术图谱(LLM Tech Map)的大模型部分主要包括以下几个方面:
- 备案上线的中国大模型:有牌照提供服务的大模型,需要注意的是大模型和相应的产品多半名称不同。
- 知名大模型:在全球范围内,已经发布了多款知名大模型,这些大模型在各个领域都取得了突破性的进展。
- 知名大模型应用:LLM 已经在多种应用场景中得到了应用,包括文本生成、机器翻译、问答、自然语言推理等。
AI Agent(LLM Agent)
LLM Agent 是指基于 LLM 技术构建的智能代理,它可以用于各种任务,比如让机器与 ChatGPT 交互,一层一层挖掘信息,自动化完成任务;比如由机器人构成的虚拟小镇。
AI 编程
让 LLM 帮你编写代码。
工具和平台
LLM 技术图谱(LLM Tech Map)的工具和平台部分主要包括以下几个方面:
- LLMOps:简单点说(大家当前在说的),就是“快速从大模型到应用”。
- 大模型聚合平台:汇聚大模型能力,提供服务。
- 开发工具:其它开发相关的 LLM 工具。
算力
LLM 模型的训练和部署需要大量的算力,算力是 LLM 技术发展的关键因素。
LLM Tech Map 已托管到 Gitee:https://gitee.com/oschina/llm-map

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
SiFive 推出两款新型高性能 RISC-V 处理器
RISC-V 芯片厂商 SiFive 宣布推出两款新产品 SiFive Performance P870 CPU 和 SiFive Intelligence X390,主要面向高性能计算和 AI/ML 应用。 SiFive Performance P870 和 SiFive Intelligence X390 提供低功耗、计算密度和矢量计算能力,旨在为消费电子、汽车技术和基础设施领域的数据密集型计算应用程序提供显着的性能提升。 SiFive 高管强调了该公司致力于推动高性能 RISC-V 创新并缩小与其他指令集架构的差距。并表示,消费电子和基础设施等领域对半导体的需求不断增长,推动了 RISC-V 生态系统的快速扩张。 SiFive Performance P870 P870 专为高性能消费类应用而设计,也可与数据中心的矢量处理器一起使用。在指令集架构可用性、吞吐量、并行性和内存带宽方面为 RISC-V 性能树立了新标准。 P870 具有一个6 发射乱序执行核心和一个共享集群高速缓存。与上一代 SiFive 性能处理器相比,P870 峰值单线程性能提升了 50% (specINT2k6...
- 下一篇
中兴通讯“星云研发大模型”:AI 编程助手、1000 亿 token
2023 年 10 月 11 日-13 日,在中国移动全球合作伙伴大会举办期间,中兴通讯“星云研发大模型”亮相,旨在辅助开发人员进行需求分析、产品设计、编程、测试、版本部署等。 据介绍,“星云研发大模型”支持白名单机制有效控制使用范围,以及代码特征值识别有效识别敏感代码片段、敏感词识别机制可实时监测并拦截敏感内容,还有后台审计机制可完整回溯安全事件等。 中兴通讯表示,2023 年 4 月,“星云研发大模型”使用启动,截至目前,日活人数达 1.2 万人,代码采纳率达 40%~45%,编码提效 30%,整体研发提效 10%。 中兴通讯将领域数据、Know-How 知识积累、数十万篇通信领域技术文档和1000 亿 token的无线 / 核心网 / 云代码语料等注入大模型,进行增量预训练,使用并行训练框架。 中兴通讯称:“自研部署方案使用动态 batch 策略、PagedAttention 技术,结合无损模型量化,吞吐量大幅提升,单 GPU(A800)达到 1500tokens / s,仅使用 4 张 GPU 卡(A800)可满足超千人使用需求。对比业界常规的部署方案,单 GPU 吞吐量分别提...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7