Unicode 15.0.0 草案已公布,新增 4488 个字符
Unicode 15.0.0 版本草案已公布,该版本的 Unicode 字符数据库、代码表和附件预计在 9 月正式发布。而且由于新内容添加所需的大量编辑工作,15.0 版的核心规范(PDF)也仍待发布。因此关于 Unicode 15.0 能介绍的东西不多,目前放出来的内容包括:
Unicode 15.0 增加了 4488 个字符(共有 149185个字符),新增的内容包括 2 个新脚本(总共 161 个脚本)和 20 个新的表情符号(Emoji)字符。其中 4192 个新字符位于 CJK(中日韩)统一表意文字扩展 H 分类中,其他详细分类请参阅增量代码图表。
几个重要的 Unicode 规范已针对版本 15.0 进行了更新,以下四个 Unicode 技术标准的版本与 Unicode 标准同步:
- UTS #10, Unicode Collation Algorithm — 对 Unicode 文本进行排序
- UTS #39,Unicode 安全机制——减少 Unicode 文本欺骗
- UTS #46, Unicode IDNA Compatibility Processing — 非 ASCII URL 的兼容处理
- UTS #51, Unicode Emoji — 与表情符号相关的数据和行为
Unicode 15.0 版通过对 Unihan 数据库进行重大更正和改进(更新的源列表、正则表达式以及更新的字段),增强了对 CJK(中日韩) 统一表意文字的支持,包括对普通话、粤语、唐代汉语、日语、中日语、韩语和越南语的读音和校对支持,还有简体中文和繁体中文更好的切换。有关 Unihan/CJK 支持的更多信息,请参阅 UAX #38,Unicode Han 数据库 (Unihan)。
除了上述内容之外,其他内容全是待定,相关的页面链接也被关闭了,想找点新的 emoji 给大伙看看都不行,只能等待 9 月 Unicode 15.0 正式发布再作介绍。
