Unicode 18.0.0 草案已于近日发布,新增 13,047 个字符,将 Unicode 总字符数推至 172,848 个。新增字符涵盖了更广泛的语言和符号体系,其中包括四个全新的书写系统:Chisoi、Proto-Cuneiform(数字)、Jurchen(女真文)和 Seal(印章文)。

书写系统的增加是本次更新最受关注的部分。Jurchen(女真文)是历史上曾被用于书写女真语言的文字系统,与契丹文和汉字有着复杂的渊源。Seal(印章文)则与古代封印和印章相关。这两套书写系统的加入,使得 Unicode 覆盖的人类文字记录边界再次拓展。
数据文件方面,新增了 JurchenSources.txt 和 SealSources.txt,用于记录这两个新书写系统的元数据来源。多个 Unicode 技术标准也同步更新:UTS #10 排序算法、UTS #39 安全机制、UTS #46 IDNA 处理、UTS #51 Emoji 以及 UTS #58 链接检测,这些技术标准分别对应文本排序、安全特殊字符、域名处理、Emoji 规范和链接检测等具体应用场景。
作为一部持续演进的国际文字编码标准,Unicode 的每一次更新都反映着人类文字记录的数字化覆盖进程。18.0.0 版本目前仍为草案状态,正式版本预计于 2026 年 9 月发布。
参考来源:Unicode.org(https://www.unicode.org/versions/Unicode18.0.0/)