杭州站源创会精彩回顾
唐谈:诗画一律--跨模态大模型在古画色彩修复中的探索与实践
王翔宇:向量数据库-AI 时代的信息检索引擎
沙雨辰:知识增强领域大模型:原理与实践
张家庆:如何打造基于开源大模型的核心竞争力
谢亚东:从模型到服务:如何高效率部署模型
Lepton AI Founding Member 谢亚东发表了《从模型到服务:如何高效率部署模型》主题演讲。模型部署是让模型从实验环境走向生产服务的重要一环。谢亚东认为,AI 的供给不断增加,从业者对 AI 的需求也在增长,越来越多非 AI 从业人员也会加入使用 AI 的行列。但 API 逐渐已不能满足人们的需求,那么,如何快速把一个模型,变成一个 API ?怎么把模型 serving 起来?
谢亚东讲述了谷歌的常规 architecture,一个机器模型上线的过程:数据抽取、数据准备、模型训练、模型评估和验证,最后训练模型。但如果只是要做一个 POC,完全可以跳开前面的步骤,直接找到线上的模型,把它 serving 起来,做成 API 和 Application,快速测试其热度。如果不火,则接着测试下一个。
如今,模型的提供商和开源模型的火爆,已使这件事变为可能。
谢亚东认为,在 AI 领域创业,就是一件比速度的事情。API 虽好,但还不够。一方面,API 发布的时间太慢,等到做成应用上线,热度早就过了;其次,如果真的想要做一款 AI 产品,需要的模型是非常多样的,因为不同的模型有不同的特性,有可能还得自己定制。开源大模型更新迭代很快,商业公司发布 API 的速度跟不上,如果是大公司,还会有安全顾虑,不希望泄露数据给商业卖家。那么如何跟上步伐,就成了最关键的事。
随后,谢亚东以 Lepton AI 和 Gpt2 为例,现场演示了如何用开源模型制作一个 model。只需要5分钟,就能在本机写出一个 service,调试好一个开源模型,并快速地把它发布到线上。这就是 Lepton AI 的云端服务。
最后,谢亚东演示了刚刚自己写的开源项目:ImgPilot。之前,大家画马是按照这样的步骤:
但现在,在这个项目里面,真的只需要画个简笔画,就能实现栩栩如生的马图了。谢亚东按照上图的步骤,只在右边的画布上画了寥寥几笔的圆形、三角组成的“马”,AI 就能自动在左边渲染出想要的真●马图,甚至还能随着笔画的变化自动变换样式,供你选择。
谢亚东认为,未来,每个人都有可能成为 AI Application 开发者,在这个过程中,model 的 serving 会变得非常重要,如何把一个模型用最短的时间变成 API,这可以成为后续业务和开发的重点。
彭博:如何在本地做“简单”的模型微调
Gitee AI 产品负责人彭博发表了《如何在本地做“简单”的模型微调》的主题分享。
目前,本地模型微调面临着很多难题,从配置 Python 源、获取模型和数据集,到本地运行、编写脚本、微调模型、集成到产品,都遇到了或硬件或软件的阻碍。
对此,彭博介绍了 Gitee 推出的应用和案例。在 Gitee 企业版上有个任务管理功能,积累了许多历史任务的数据,如今如果要新建任务,就可以利用大模型进行分析推荐,帮助决策。如:这个任务谁来负责比较好?
彭博选择了一种文本分类的模型 Bert 进行演示,从配置 Python 源、加载数据集、训练模型,到评估结果的全过程。与本地训练相比,Hugging Face 准确度更高,成本也更低,耗时也短。训练好之后,用一个任务进行测试,结果推荐的人选,也很符合彭博的印象。模型最后不仅能列出该人选的准确率,还能给出选择的理由,作为辅助决策是成功的。
Gitee AI 也在做跟 Hugging Face 一样的事情,期望能给国内的开发者扫除使用模型的障碍,降低使用 AI 的成本,未来也会推出对标的产品。主要分三类:一是模型引擎,二是应用引擎,三是训练引擎。其中,模型引擎对应 Hugging Face 的 Inference API 和 Inference Endpoints,覆盖测试和生产的模型推理部署。应用引擎将辅助做 Demo 做演示。训练引擎将基于应用引擎提供模型微调能力。未来,Gitee AI 还会考虑做 web 版本的 AI 开发环境,供大家测试和使用。
目前,Gitee AI 已同步了 Hugging Face 最受欢迎、下载量最多的几千个模型和数据集,并提供了对 huggingface_hub API 的基础适配,能兼容模型和数据集的下载。应用引擎可以让用户轻松的运行 AI 应用 Demo 以及进行模型微调。
11 月源创会到此就结束啦,小伙伴们下期见!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Turbo Pascal 诞生 40 年
Turbo Pascal 迎来了 40 岁生日。 1983 年 11 月 20 日,Borland 公司发布了 Turbo Pascal 的第一个版本。该版本的编译器核心部分由Anders Hejlsberg授权给 Borland 公司。 Anders Hejlsberg 为 MS-DOS 和 CP/M 设计了 Pascal 编译器,Borland 买下该编译器并改称 Turbo Pascal,之后 Anders Hejlsberg 也加入了 Borland 公司,并且是后来所有 Turbo Pascal 版本与 Delphi 前 3 个版本的架构师。 Turbo Pascal 作为一种结构化编程语言,它对计算机编程产生了重大影响,并成为了许多程序员的入门语言。 延伸阅读 Delphi 26 岁 Delphi 11 和 C++Builder 11 社区版发布 Delphi 12 & C++ Builder 12、RAD Studio 12 发布
- 下一篇
去哪儿“技术债”偿还实践:如何高效、低风险砍掉50%无用代码?
一分钟精华速览 底层技术是系统稳定运行的基石,往往牵一发而动全身。通过底层技术的优化,有效地管理和减少代码量,能极大提升系统的运行效率。去哪儿网作为业内较早落地“代码瘦身”的企业,该项目让其系统成功地减少了 50%的代码量,26%的服务数量,提高了 9.5%的发布效率。 本文旨在分享其如何运用可观测性技术识别并清除无用代码,并尝试通过还原实施细节、总结方法论,并为读者在系统精简方面提供一种新的思考和实践方式。 作者介绍 去哪儿旅行基础架构组技术专家——马阳阳 TakinTalks 稳定性社区专家团成员,去哪儿旅行基础架构组技术专家。公司云原生 SIG 成员,负责测试环境治理平台、代码精简平台、组件市场等,专注于研发效能领域。2022 年深度参与的“线上代码精简 50%”项目获得公司级技术型一等奖,指导多个团队完成系统精简,积累了大量经验。 温馨提醒:本文约 7500 字,预计花费 12 分钟阅读。 「TakinTalks 稳定性社区」公众号后台回复 “交流” 进入读者交流群;回复“回放”获取可观测系列合集; 背景 一个普遍而持久的问题:随着时间的流逝,系统中逐渐堆积起了大量的历史债务,...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- 2048小游戏-低调大师作品
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G