txtai 4.0 正式发布,构建 AI 驱动的语义搜索应用
txtai 4.0 已正式发布,这是一个具有大量新特性的重要版本,同时也会兼容旧版本,增加了诸如内容存储、对象存储、使用 SQL 查询、索引压缩、重新索引(reindexing)、外部向量等功能。
数据方面,新版发布之后,代码量增加了 50%,解决了 36 个问题,据称是迄今为止最大的版本。
新特性
- 支持存储文本内容(#168)
- 添加选项以索引内容字典(#169)
- 添加 SQL 支持以生成结合嵌入 (embedding) + 数据库查询 ( #170 )
- 将 reindex 方法添加到嵌入(#171)
- 添加对索引存档的支持(#172)
- 为嵌入添加关闭方法(#173)
- 更新 API 以使用嵌入 + 数据库搜索 ( #176 )
- 为表格管道 (tabular pipeline) 添加内容选项(#177)
- 更新工作流示例以支持嵌入内容 ( #179 )
- 将索引元数据添加到嵌入配置(#180)
- 添加对象存储(#183)
- 聚类时会聚合部分查询结果(#184)
- 将函数参数添加到嵌入重新索引(#185)
- 添加对用户定义的列别名的支持(#186)
- 使用 SQL 括号表示法支持多词和更复杂的 JSON 路径表达式 ( #187 )
- 支持 SQLite 3.22+ ( #190 )
- 添加预先计算的向量支持(#192)
- 更改文档/对象插入以仅保留最新记录(#193)
- 更新包含 4.0 变化的文档 ( #196 )
改进
- 修改工作流以选择带有切片的批处理 ( #158 )
- 为工作流添加张量支持 ( #159 )
- 如果作为文件路径提供,则读取 YAML 配置 ( #162 )
- 向 API 添加管道更容易(#163)
- 支持同时处理任务动作(#164)
- 添加张量工作流 notebook(#167)
- 更新默认 ANN 参数 ( #174 )
- 要求 Python 3.7+ ( #175 )
- 一致地命名嵌入 id 字段(#178)
- 添加 txtai 版本属性(#181)
- 修改嵌入以仅对输入文档进行一次迭代(#189)
- 提升向量转换的效率 ( #191 )
Bugfix
- 在 API 写入调用周围添加线程锁 ( #160 )
- 通过 API 公开 caption 和 objects ( #161 )
- 更改 pickle 调用以使用支持最低 Python 版本的协议 ( #182 )
- HFOnnx 预期的 ORT provider 错误 ( #195 )
txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立了一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问-答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
IPython 8.0 发布,Python 命令行交互工具
IPython 是 Python 的原生交互式 shell 的增强版,可以完成许多不同寻常的任务,比如帮助实现并行化计算;主要使用它提供的交互性帮助,比如代码着色、改进了的命令行回调、制表符完成、宏功能以及改进了的交互式帮助。 IPython8.0 酝酿了许久,主要对现有代码库和几个新功能进行了改进。新功能包括在 CLI 中使用 Black 重新格式化代码、ghost 建议以及突出错误节点的更好的回溯,从而使复杂的表达式更易于调试。 追溯改进 之前的错误回溯显示一个散列表(hash),用于编译 Python AST: In [1]: def foo(): ...: return 3 / 0 ...: In [2]: foo() --------------------------------------------------------------------------- ZeroDivisionError Traceback (most recent call last) <ipython-input-2-c19b6d9633cf> in <...
- 下一篇
magic-api 1.7.5 发布,接口快速开发框架
本次更新内容: 新增try with resources语法支持 修复在使用log的情况下DEBUG可能造成线程阻塞的问题 修复mybatis模式中的部分转义错误 修复finally代码块在部分情况表现与Java不一致的问题 修复集合、数组扩展方法distinct方法返回值是Set的BUG 优化扩展方法缓存,提升调用扩展方法性能 优化单表拦截器API,调整UPDATE执行时机 优化代码提示、错误提示 提示 1.x版本后续除了修复BUG以外不会再新增功能,新功能将在2.x版本中 目前2.x分支基本开发完毕,在1.x基础上的修改项如下: 前台使用vue3重写,UI细节优化 支持显示在线人数,他人正在编辑的接口。 后台重构,以便更加方便的添加新功能 支持i18n国际化(目前完成60%) 支持定时任务在线配置 备份机制重构,支持自动全量备份并从全量备份中还原。 移除assert模块,改用assert语法,正在使用assert模块的,强烈建议改为assert语法,方便后续升级 Elastsearch模块(开发中) 解构语法(开发中) 需要体验的可以在Gitee下载源码,自行编译2.x分支引入使用...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8编译安装MySQL8.0.19
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS6,CentOS7官方镜像安装Oracle11G