.NET 8 极致性能优化 Non-GC Heap
前言
.NET8里面JIT引入了一个新的机制,叫做Non-GC Heap。JIT可以确保相关对象分配在Non-GC Heap上,该堆像其名称一样,不受GC管理。JIT需要保证这个对象没有被GC引用,并且在这个对象的生命周期内一直是根对象(不会被GC消灭的对象)的状态。原文:.NET8极致性能优化Non-GC Heap
概述
为什么要引入这种机制?先来看一段代码:
public static string GetPrefix() => "https://"; static void Main(string[] args) { GetPrefix (); }
这里的GetPrefix函数返回的是一个常量字符串值,它的ASM如下:
mov rax,185CAC02068h mov rax,qword ptr [rax]
两个mov指令,第一个是对象指针的指针,第二个是对象的指针。虽然是简单的两个指令,但是背后的逻辑却较为复杂,基本如下:
一个字符串常量值,.NET7里面JIT也会给这个字符串常量值复制到一个堆分配到字符串对象中,返回的是对象的二级指针。因为是堆对象,可能会被GC移动,每次都需要获取新的地址,频繁增加负担。
这里的问题在哪儿呢?一个字符串常量值需要这么多的步骤操作吗?开销是否太大,我们是否可以简化它呢?有一个常规的很容易想到的方法,就是把这个字符串常量值的地址给它固定起来,每次需要用到这个常量值,就直接去这个固定地址读取,这样行不行呢?GC堆很明显不能硬编码固定。
当然可以,做法就是把这个字符串常量值放到POH(固定对象堆)上,不让GC移动。这样是减少了GC回收的时候移动的开销,但是并没有从根本上解决问题,因为固定对象同样受到GC的管控,上面的步骤除了不能移动一样不少,并且POH不会进行根对象的处理,可能会导致它们被回收,地址指向了其它的数据,进而错误。
特点
要彻底的解决这个问题,本篇的主角:Non-GC Heap出场了。它有三个特点:
1.JIT要保证这个对象没有被GC引用
2.这个对象在生命周期内一直是根对象
3.它不能是可卸载上下文的一部分
你可以认为GC堆包括:小对象堆(SOH-小于85000字节的对象),大对象堆(LOH-大于85000字节的对象),固定对象堆(POH)
而No-GC Heap超脱于GC Heap之外的FOH(冻结堆)。
JIT现在可以避免在生成的代码中访问该对象时的间接寻址,而是直接硬编码对象的地址
GetPrefix函数的ASM在.NET8 Non-GC Heap里面如下:
mov rax,26180000218h C3 ret
26180000218h为对象地址,一个mov直接返回。看似只简化了一个mov,但是实际上它这种硬编码固定模式地址,简化的是整个字符串常量值的原理,也就是把字符串常量值分配到FOH里面,而不是GC堆里。性能极大的提升自不必多说。以下测量13倍的性能提升。
Method Job Mean Ratio GetPrefix .NET 7 1.3450 ns GetPrefix .NET 8 0.0729 ns
其它Non-GC Heap的操作
一:使用typeof(T)生成的RuntimeType对象
public Type GetTestsType() => typeof(Tests);
二:空数组分配到Non-GC Heap上,使Array.Empty()更加高效
public string[] Test() => Array.Empty<string>();
它俩在.NET8里面都类似于如下ASM,一个mov直接返回:
mov rax,1A0814EAEA8 ret
三:静态值类型字段关联的堆对象,不包含任何GC引用的字段
public partial class Tests { private static readonly ConfigurationData s_config = ConfigurationData.ReadData(); public TimeSpan GetRefreshInterval() => s_config.RefreshInterval; private struct ConfigurationData { public static ConfigurationData ReadData() => new ConfigurationData { Index = 0x12345, Id = Guid.NewGuid(), IsEnabled = true, RefreshInterval = TimeSpan.FromSeconds(100) }; public int Index; public Guid Id; public bool IsEnabled; public TimeSpan RefreshInterval; } }
RefreshInterval .NET7如下:
mov rax,13D84001F78 mov rax,[rax] mov rax,[rax+20] ret
RefreshInterval .NET8如下:
mov rax,20D9853AE48 mov rax,[rax] ret
四:代之间的GC引用判断
代码:
public class Tests { public void Write() { string dst = "old"; Write(ref dst, "new"); } [MethodImpl(MethodImplOptions.NoInlining)] private static void Write(ref string dst, string s) => dst = s; }
Write在.NET7和.NET8上生成如下:
call CORINFO_HELP_CHECKED_ASSIGN_REF nop ret
CORINFO_HELP_CHECKED_ASSIGN_REF是一个JIT帮助程序函数,其中包含所谓的“GC write barrier (GC写屏障)”,一个小代码片段,用于让GC跟踪正在写入的引用,因为它可能需要知道,例如,因为正在分配的对象可能是gen0,而目标可能是gen2。
微调下这个代码:
public class Tests { public void Write() { string dst = "old"; Write(ref dst); } [MethodImpl(MethodImplOptions.NoInlining)] private static void Write(ref string dst) => dst = "new"; }
- 实现的功能都是一样的,只不过dst直接赋值了常量字符串,记得上面常量字符串的分配是在Non-GC Heap吗?.NET7里面还是需要帮助函数:
mov rdx,1FF0E4014A0 mov rdx,[rdx] call CORINFO_HELP_CHECKED_ASSIGN_REF nop ret
然.NET8里面则是
mov rax,1B3814EAEC8 mov [rcx],rax ret
因为.NET8意识到常量字符串是在Non-GC Heap,不需要GC跟踪判断在那个代码,类似于card_table那种。所以优化掉了CORINFO_HELP_CHECKED_ASSIGN_REF
往期精彩回顾:
作者:江湖评谈。公众号:jianghupt.欢迎关注。文章首发地。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
中国科学院软件所在开源自动驾驶平台建设方面取得进展
中国科学院软件研究所可信智能系统团队在开源自动驾驶(Self-driving System)平台建设方面取得进展,构建了一个开放易用且自主可控的自动驾驶算法开发、测试、仿真与验证平台 ISS。该成果得到中国科学院稳定支持基础研究领域青年团队计划“开放环境下的可信智能算法”项目支持。 根据介绍,ISS平台基于模块化的框架并以依赖库较少的方式实现了涵盖自动驾驶全流程(包括感知、建图、定位、预测、规划与控制等)的几十种基准算法(如图1所示),使用简单、易于扩展,可以为科研人员开展自动驾驶相关研究提供基础平台支撑。 图1. ISS平台架构 ISS平台具体实现了以下六大模块功能。 传感器模块:基于CARLA仿真器支持了常用的传感器; 感知模块:基于深度学习方法实现了2D检测、2D语义分割、Bev地图生成、3D目标检测等感知任务; 预测模块:实现了匀速运动预测和基于Motion Transformer的预测; 定位模块:实现了基于激光雷达、惯性测量单位、全球定位系统等的单传感器定位和基于卡尔曼滤波器等过滤器的多传感器融合定位; 规划模块:实现了基于Lanelet2的FloodFill路线规划算法、...
- 下一篇
BetterGI(更好的原神) - 开源免费的原神游戏辅助工具
BetterGI , 一个基于计算机视觉技术,意图让原神变的更好的项目。 BetterGI · 更好的原神 - 自动拾取 | 自动剧情 | 全自动钓鱼(AI) | 全自动七圣召唤 | 自动伐木 | 自动派遣 | 一键强化 | 支持云原神 功能 特色:自带一个遮罩窗口覆盖在游戏界面上,用于显示日志和图像识别结果。 实时任务 自动拾取 自动剧情 自动领取『每日委托』奖励 自动重新派遣 全自动钓鱼(AI) 独立任务 自动七圣召唤 自动伐木(迁移中) 操控辅助 空格连发 F 连发 那维莱特 - 转圈圈 快速圣遗物强化 更多功能筹备中... 界面截图
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS8安装Docker,最新的服务器搭配容器使用
- Hadoop3单机部署,实现最简伪集群
- MySQL8.0.19开启GTID主从同步CentOS8
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS8编译安装MySQL8.0.19
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境