OpenBLAS 0.3.21 发布,支持龙芯 2K1000 处理器
OpenBLAS 0.3.21现已发布,OpenBLAS 是一个优化的 BLAS 库,基于 GotoBLAS2 1.13 BSD 版本。 BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法)。该程序集最初发布于 1979 年,并 用于建立更大的数值程序包(如 LAPACK)。在高性能计算领域,BLAS 被广泛使用。例如,LINPACK 的运算成绩则很大程度上取决于 BLAS 中子程序 DGEMM 的表现。为提高性能,各軟硬件厂商则针对其产品对 BLAS 接口实现进行高度优化。 一些更新亮点如下: 现在支持使用 Intel IFX、Fujitsu FCC 和 Cray C/Fortran 编译器构建 OpenBLAS。 初步支持兆芯/Centaur KH40000 处理器。 OpenBLAS 的 CMake 构建系统现在支持对单个 Intel 和 AMD x86_64 目标进行交叉编译。现在有暴露的 CMake 目标,从 Intel Prescott 到 ...