Apache Solr 8.3.0 发布,Java 全文搜索服务器
Apache Solr 8.3.0 发布了。Apache Solr 是一个开源的搜索服务器,使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的。每个文档由一系列的 Field 构成,每个 Field 表示资源的一个属性。Solr 中的每个 Document 需要有能唯一标识其自身的属性,默认情况下这个属性的名字是 id,在 Schema 配置文件中使用 id 进行描述。
Solr 8.3.0 值得关注的更新:
- 二维路由别名现在可用于基于两个字段的数据值来组织集合
- SPLITSHARD 实现了一个新的 splitByPrefix 选项,该选项在使用 CompositeIds 时考虑了实际的文档分发
- QueryElevationComponent 可以将查询规则配置为 match=“subset”,其中单词仅需要与查询单词的子集匹配,并且顺序任意
- 用于将文档导出到文件的命令行选项
- 支持确定性副本路由首选项,以更好地使用缓存
- 能够在 Solr Admin UI 中查询别名
- JWTAuthPlugin 支持多个 JWKS 端点和多个 IdP 发行者
- JSON 构面现在支持范围构面的任意范围
- 通过数学表达式支持积分图、余弦距离和字符串截断
- 新的 cat() 流源可从本地文件中的行创建元组
- 添加上,下,修剪和拆分流评估器
- 添加 CsvStream,TsvStream 流表达式并支持流评估器
- 添加 CaffeineCache,这是 SolrCache 的有效实现
- 由于在检查当前分片是否处于活动状态与稍后检查是否有任何子分片头将更新转发到之间,集群状态发生变化,实时 SPLITSHARD 可能会丢失更新
- 修复 SPLITSHARD(异步)并导致基础子操作失败可能会导致数据丢失
- 允许动态调整 SolrCache-s 的大小
- 允许对通过 'bin/solr autoscaling -save' 保存的数据进行可选编辑
- 优化大型托管模式修改(内部 O(n^2) 问题)
- ……
其余还包括大量更新内容,详情见更新说明。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Git 2.24 发布,分布式版本控制系统
Git 2.24已经发布,该版本包含了来自 78 个贡献者的功能增加和 bug 修复。其中带来一些亮点,比如特性宏,commit-graph,新可选全新的仓库历史重写工具 filter-repo 等,内容如下: Feature macros 在 Git 2.24 中,可以选择使用 feature 宏功能(一种包含许多其他功能的 Git 配置)。这些是由 Git 的开发人员手动选择的,通过它可以选择加入某个功能或根据存储库的特性采用一些设置。例如,假设有一个特别大的存储库,当我们发现其运行缓慢时,通常会将 index.version 设置为 4,但这并不是好的解决方法。而现在有另外一种选择:通过下面方式启用 feature.manyFiles: git config feature.manyFiles true 目前 feature 宏功能只包括 feature.experimenta l和 feature.manyFiles,以后可能会新添加新的宏。 Commit graphs by default(默认启用提交图) 在 Git 2.24 中,默认会启用提交图,此前该功能是在实验性...
- 下一篇
每日一博 | Gitee 存储库体积控制策略
前言 作为全球第二大的代码托管平台,Gitee 拥有350W 用户和 600W 存储库,海量的存储库对 Gitee 的硬件设施提出了更高的要求,以 600W 存储库为例,如果按照平均 1GB 的大小磁盘体积,这些存储库将需要总共 5860 TB 的空间,按照 Gitee 每台存储磁盘 14TB,则需要 419 台存储设备。实际上在 Gitee 中,绝大多数存储库的体积都小于 100 M,超过 100 M 的存储库通常都是未合理使用 git。尽管如此,Gitee 仍然需要投入大量的存储设备来支撑用户的接入。为了能够让更多的人能够免费使用 Gitee,我们迫不得已只能限制大存储库的访问。近期,Gitee 存储库路由架构改造第一阶段已经到了收尾截断,在此期间,我们将陆续将服务端的钩子切换到 GNK (Gitee Native Hook),GNK 基于 C++ 编写,使用了 Git 环境隔离等高级特定,意味着大文件检测和存储库体积检测不会再有漏网之鱼。一些用户的存储库体积已经超过了 Gitee 配额限制,而之前的钩子检测存在缺陷,无法实时拦截大存储库和大文件,当切换到 GNK 后,这些用户修改...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8编译安装MySQL8.0.19
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Hadoop3单机部署,实现最简伪集群
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果