xAI 推出首款多模式模型 Grok-1.5V
xAI 宣布推出 Grok-1.5V —— 第一代多模式模型,用于连接数字世界和物理世界。
除了强大的文本功能之外,Grok 现在可以处理各种视觉信息,包括文档、图表、屏幕截图和照片,预计该版本很快就会向早期测试者和现有 Grok 用户推出。
公告指出,Grok-1.5V 在多个领域(从多学科推理到理解文档、科学图表、图表、屏幕截图和照片)与现有的前沿多模态模型相比都具有很强的竞争力。在 RealWorldQA 基准测试中的表现也要优于同类产品。
RealWorldQA 是由 xAI 新推出的一个基准测试,旨在评估多模态模型的基本真实世界空间理解能力。
RealWorldQA 的初始版本包含 700 多张图像,每张图像都有一个问题和易于验证的答案。除了其他真实世界的图像之外,该数据集还包含从车辆拍摄的匿名图像。后续还将随着多模式模型的改进而进行扩展,RealWorldQA 在CC BY-ND 4.0 下发布。现已可供下载 (677MB)。
示例:看图写代码
用户:你能把它翻译成 Python 代码吗?
Grok:当然可以!您提供的流程图描述了一个简单的猜谜游戏:计算机生成一个随机数,用户必须猜出它。下面是表示流程图中逻辑的 Python 代码:
import random def guess_number(): # Generate a random number between 1 and 10 target = random.randint(1, 10) while True: guess = int(input("Guess a number between 1 and 10: ")) if guess == target: print("You won!") break else: print("Wrong guess, try again!") if __name__ == "__main__": guess_number()
在接下来的几个月中,Grok 预计将在图像、音频和视频等各种模式中对这两种功能进行重大改进。与此同时,该公司还在进行招聘。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Ant Design 5.16.2 发布,企业级 UI 设计语言和 React 实现
An Design 5.16.2 现已发布,主要变化如下: 修复 Input.OTP 组件受控设置value为''时不生效的问题。#48399 修复 DatePicker 对周选择器配置multiple多选时,弹出面板不会正确高亮选中项的问题。#48355 修复 Upload 配置listType为picture-card或picture-circle时,上方有额外空隙的问题。#48370 Typography 修复 Typography 动态配置copyable或editable时不会显示操作按钮的问题。#48350 修复 Typography 动态调整copyable.text不生效的问题。#48347 修复 Typography 的ellipsis同时配置expandable="collapsible"和row={1}时,不会正确省略的问题。#48340 修复 Steps 的进度样式在紧凑模式下不正确的问题。#48251 重构 Tabs 和波纹样式相关组件的 CSS 过渡时间值,替换为motionDurationSlowComponent Token。#48311#48312 补...
- 下一篇
苹果 iOS 18 的首批 AI 功能将完全运行于设备端
彭博社记者 Mark Gurman 报道称,苹果计划为 iOS 18 推出的首批 AI 功能将完全在端侧上运行,不依赖云服务器。 iOS 18 预计不会包含苹果自己的类 ChatGPT 的聊天机器人,但目前还不清楚 Gemini 或其他聊天机器人是否会直接集成到 iOS 18 中。 Gurman 表示,目前看来苹果即将在 WWDC 上发布的 AI 技术将完全在设备本地运行,为新功能提供支持的大语言模型将不会在云端处理。 Gurman 补充,苹果可能未来会提供一些基于云端的 AI 功能,此前有报道称苹果已经和 Google、OpenAI 和百度等公司就 AI 上的合作进行了讨论,不过有知情人士否认了百度和苹果之间关于 AI 的合作。 科技媒体MacRumors 则分析认为苹果仍有可能推出自家基于云的生成式 AI,因为此前也有消息指出,苹果正在积极购买 AI 服务器。 传闻称,iOS 18 将为 iPhone 的 Spotlight 搜索工具、Siri、Safari、快捷指令、Apple Music、信息、健康、Numbers、Pages、Keynote 等应用带来全新的生成式 AI 功能...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Linux系统CentOS6、CentOS7手动修改IP地址
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS关闭SELinux安全模块
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Hadoop3单机部署,实现最简伪集群
- CentOS6,7,8上安装Nginx,支持https2.0的开启