苹果发布开源多模态大语言模型 Ferret
科技媒体 VentureBeat 报道称,苹果公司在 2023 年 10 月低调发布了一款名为 Ferret 的开源多模态大语言模型,这是苹果与哥伦比亚大学研究人员的合作成果。当时发布的内容包括了代码和权重(仅限研究用途,不包含商业许可),但并未引起太多关注。
随着近期Mistral 的开源 MoE 模型成为焦点,以及谷歌的 Gemini 模型即将在 Pixel Pro 上亮相,未来还将进入 Android 系统,越来越多人开始关注本地 LLMs 为小型设备提供支持的潜力。
近日,专注于医疗领域开源 AI 的欧洲非营利组织负责人 Bart de Witte 在 X 平台上分享了他的惊讶:“我之前竟然没发现这个。” 他表示,“苹果在 10 月份加入了开源 AI 圈子。Ferret 的推出展现了苹果对影响深远的 AI 研究的承诺,巩固了它在多模态 AI 领域的领先地位…… 另外,我很期待有一天 Local Large Language Models (LLLMs) 能作为重新设计的 iOS 的一部分,在我的 iPhone 上运行。”
苹果公司 AI/ML 研究科学家 Zhe Gan 在 10 月份发布的一条推文中解释了 Ferret 的用途 —— 一个可以在图像中 "以任何粒度对任何地方的任何东西进行参照和定位" 的系统。它还可以通过使用图像中任何形状的区域来做到这一点。
简单地说,该模型可以分析图像上绘制的区域,确定其中对用户查询有用的元素,并将其识别出来,在检测到的元素周围绘制一个边界框。然后,它就可以将识别出的元素用作查询的一部分,并以典型的方式作出响应。
例如,高亮显示图像中的动物图片并询问 LLM 这是什么动物,LLM 可以确定该动物的种类,并确定用户所指的是动物群中的某只动物。然后,它还可以利用图像中检测到的其他项目的上下文,提供进一步的回复。
GitHub:https://github.com/apple/ml-ferret
论文:https://arxiv.org/abs/2310.07704
Ferret 拥有 (7B, 13B) 两个版本,为了增强 Ferret 模型的能力苹果特别收集了一个 GRIT 数据集。它包含了 1.1M 个样本,这些样本包含了丰富的层次空间知识。
尽管苹果以往以其产品和技术的封闭性著称,但现在它通过发布开源LLM模型,正逐渐改变这一形象,展现出其在AI领域的活跃参与和创新精神。这不仅对苹果自身,也对整个AI领域来说,都是一个值得关注的重要发展方向。
VentureBeat 撰稿人 Ben Dickson 写道:“2023 年最让你意外的人工智能进展是什么?对我来说,是苹果发布了开源 LLMs(虽然是非商业许可)。”他指出,苹果一贯以来是封闭系统、围墙花园开发、保密、严格的保密协议、发布极少细节、并为其产品申请每一项小的专利的代表。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
De4py —— Python 逆向工程工具包
De4py 是一款高级 python 反混淆器,拥有漂亮的用户界面和一系列高级功能,可帮助恶意软件分析师和反向工程师对 python 文件等进行反混淆。 特征 功能 反混淆 De4py 支持一些流行的混淆器,例如:Jawbreaker、BlankOBF、PlusOBF、Wodx、Hyperion、pyobfuscate.com 混淆器 Pycode执行 在进程内执行 python 代码,这在许多情况下很有用,可以使程序执行您想让它执行的操作,例如,如果程序具有许可并且它调用真正的“main”只有购买了程序才可以直接调用。 字符串转储 在 python 进程中转储字符串并将其保存为文件,这对于从内存中提取数据(例如 webhook)非常有用。 删除退出功能 删除退出函数,如果 python 程序在找到调试器或虚拟机时尝试退出,该函数将非常有用 获取所有功能 获取 python 进程内的所有函数,这在尝试修改内存中的 python 函数时非常有用 Pyshell图形用户界面 自定义 GUI,可以轻松在所需进程内执行 python 代码。 GUI 和控制台支持 De4py 同时支持控制台和 ...
- 下一篇
OpenAI 拟以 1000 亿美元估值开启新一轮融资
彭博社援引知情人士消息称,OpenAI正在以 1000 亿美元或以上的估值筹集新一轮融资,相关谈判尚处于早期阶段。这笔交易将巩固这家 ChatGPT 制造商作为全球最有价值初创公司之一的地位。 可能参与本轮融资的投资者的相关信息并未有过多透露,且本轮融资的条款、估值和时间安排等细节也尚未最终确定,仍可能发生变化。根据 CBInsights 的数据,如果本轮融资按计划进行,那么 OpenAI 将成为美国价值第二高的初创企业,仅次于 Elon Musk 的太空探索技术公司(SpaceX)。 OpenAI 对此拒绝置评。 知情人士称,OpenAI 还与阿布扎比 G42 进行了商讨,为一家新的芯片合资企业募集资金。其中一位知情人士称,OpenAI 已经讨论过从 G42 筹集 80 亿至 100 亿美元的资金。目前尚不清楚芯片合资企业和公司更广泛的融资计划之间是否有关联。 事实上,OpenAI 首席执行官 Sam Altman 一直在为代号为 Tigris 的芯片制造项目寻求资金。据彭博社上个月报道,其目标是生产能够与英伟达半导体竞争的半导体。 10 月份,G42 曾宣布与 OpenAI 合作,...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Windows10,CentOS7,CentOS8安装Nodejs环境
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS关闭SELinux安全模块