鸿蒙内核源码分析(汇编传参篇) | 汇编如何传递复杂的参数? | 中文注解HarmonyOS源码

鸿蒙内核源码分析(汇编传参篇) | 汇编如何传递复杂的参数? | 中文注解HarmonyOS源码 | v23.01

2021-01-27 611

鸿蒙内核源码注释 >> 精读内核源码,中文注解分析,深挖地基工程,大脑永久记忆,四大码仓每日同步更新

鸿蒙内核源码分析 >> 故事说内核,问答式导读 ,生活式比喻,表格化说明,图形化展示,主流站点每日同步更新

汇编如何传复杂的参数?

鸿蒙内核源码分析(汇编基础篇) | CPU在哪里打卡上班 ? < CSDN | OSCHINA | WeHarmony | 源动力 >中很详细的介绍了一段具有代表性很经典的汇编代码，有循环，有判断，有运算，有多级函数调用。但有一个问题没有涉及,就是很复杂的参数如何处理? 实际在开发过程中函数参数往往是很复杂的结构体,那复杂参数(比如结构体)怎么传递呢? 先看一段C语言和编译的汇编代码

#include <stdio.h>
#include <math.h>
struct reg{
    int Rn[100];
    int pc;
};

int fp(reg cpu)
{
    return cpu.Rn[0] * cpu.pc;
}

int main()
{
    reg cpu;
    cpu.Rn[0] = 1;
    cpu.pc = 2;
    return fp(cpu);
}

//编译器: armv7-a gcc (9.2.1)
fp(reg):
        sub     sp, sp, #16     @申请栈空间
        str     fp, [sp, #-4]!  @保护fp帧指针,等同于push {fp}
        add     fp, sp, #0      @fp新值,同时也指向了栈顶
        add     ip, fp, #4      @定位到入栈口,让剩余参数依次入栈 
        stm     ip, {r0, r1, r2, r3}@r0-r3入栈保存
        ldr     r3, [fp, #4]    @取值cpu.pc = 2    
        ldr     r2, [fp, #404]  @取值cpu.Rn[0] = 1
        mul     r3, r2, r3      @cpu.Rn[0] * cpu.pc
        mov     r0, r3          @返回值r0带回
        add     sp, fp, #0      @重置sp
        ldr     fp, [sp], #4    @重置fp
        add     sp, sp, #16     @归还栈空间
        bx      lr              @跳回main函数
main:
        push    {fp, lr}        @入栈保存调用函数现场                     
        add     fp, sp, #4      @fp更新
        sub     sp, sp, #800    @分配800个栈空间给main
        mov     r3, #1          @r3 = 1
        str     r3, [fp, #-408] @将1放置 fp-408处
        mov     r3, #2          @r3 = 2
        str     r3, [fp, #-8]   @将2放置 fp-8处
        mov     r0, sp          @r0 = sp
        sub     r3, fp, #392    @r3 = fp - 392
        mov     r2, #388        @只拷贝388,剩下4个由寄存器传参
        mov     r1, r3          @保存由r1保存r3,用于memcpy
        bl      memcpy          @拷贝结构体部分内容,将r1的内容拷贝r2的数量到r0
        sub     r3, fp, #408    @定位到结构体剩余未拷贝处
        ldm     r3, {r0, r1, r2, r3} @将剩余结构体内容通过寄存器传参
        bl      fp(reg)         @执行fp
        mov     r3, r0          @返回值给r3
        nop @用于程序指令的对齐
        mov     r0, r3          @再将返回值给r0
        sub     sp, fp, #4      @恢复SP值
        pop     {fp, lr}        @出栈恢复调用函数现场
        bx      lr              @跳回调用函数

两个函数对应两段汇编,干净利落,去除中间各项干扰,只有一个结构体reg,具体来看看汇编如何传递它,它在栈中的数据变化是怎样的?

入参方式

结构体中共101个栈空间(一个栈空间单位四个字节),对应就是404个字节地址. main上来就申请了 sub sp, sp, #800 @分配800个栈空间给main,即 200个栈空间

int main()
{
    reg cpu;
    cpu.Rn[0] = 1;
    cpu.pc = 2;
    return fp(cpu);
}

但main函数只有一个变量,只要101个栈空间,其他都算上也用不了200个的.为什么要这么做呢? 而且注意下里面的数字 388, 408, 392 这些都是什么意思? 看完main汇编能得到一个结论是 200个栈空间中除了存放了main函数本身的变量reg cpu外 ,还存放了 fp函数的参数cpu的部分值,存放了多少个?答案是 97个. 注意变量CPU没有共用,而是拷贝了一部份.如何拷贝的?继续看

memcpy汇编调用

        mov     r0, sp          @r0 = sp
        sub     r3, fp, #392    @r3 = fp - 392
        mov     r2, #388        @只拷贝388,剩下4个由寄存器传参
        mov     r1, r3          @保存由r1保存r3,用于memcpy
        bl      memcpy          @拷贝结构体部分内容,将r1的内容拷贝r2的数量到r0
        sub     r3, fp, #408    @定位到结构体剩余未拷贝处
        ldm     r3, {r0, r1, r2, r3} @将剩余结构体内容通过寄存器传参

看这段汇编拷贝,意思是从r1开始位置拷贝r2的数量到r0的位置,而且只拷贝了 388个,也就是 388/4 = 97个栈空间.剩余的4个通过寄存器传的参数.ldm代表从fp-408的位置将内存地址的值连续的给 r0 - r3寄存器

fp参数取用

fp(reg):
        sub     sp, sp, #16 @申请栈空间
        str     fp, [sp, #-4]!@保护fp帧指针,等同于push {fp}
        add     fp, sp, #0  @fp新值,同时也指向了栈顶
        add     ip, fp, #4  @定位到入栈口,让剩余参数依次入栈 
        stm     ip, {r0, r1, r2, r3}@r0-r3入栈保存
        ldr     r3, [fp, #4] @取值cpu.pc = 2    
        ldr     r2, [fp, #404]@取值cpu.Rn[0] = 1
        mul     r3, r2, r3  @cpu.Rn[0] * cpu.pc
        mov     r0, r3  @返回值r0带回
        add     sp, fp, #0  @重置sp
        ldr     fp, [sp], #4 @重置fp
        add     sp, sp, #16 @归还栈空间
        bx      lr  @跳回main函数

fp申请了4个栈空间就是用来存放四个寄存器值的,注意它和另外的reg cpu 97个栈空间是连续的. 同时 add fp, sp, #0 表示fp指向了栈顶位置 fp+404 和 fp+4 刚好取到了 cpu.Rn[0] 和 cpu.pc 的值. 如此完成了乘法运算.

总结

因为寄存器数量有限,所以只能通过这种方式来传递大的参数,也只能在main函数栈中保存,也必须确保数据的连续性. 一部分通过寄存器传,一部分通过拷贝的方式倒是挺有意思的.

喜欢就请注入源动力吧

各大站点搜 "鸿蒙内核源码分析",快速找到组织.或者更简单的,如图:

鸿蒙内核源码注释 >> 精读内核源码,中文注解分析,深挖地基工程,大脑永久记忆,四大码仓每日同步更新

鸿蒙内核源码分析 >> 故事说内核,问答式导读 ,生活式比喻,表格化说明,图形化展示,主流站点每日同步更新

微信关注我们

原文链接：https://my.oschina.net/u/3751245/blog/4927892

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

有赞个性化推荐能力的演进与实践

日前，由又拍云举办的大数据与 AI 技术实践｜Open Talk 杭州站沙龙在杭州西溪科创园顺利举办。本次活动邀请了有赞、个推、方得智能、又拍云等公司核心技术开发者，现场分享各自领域的大数据技术经验和心得。以下内容整理自有赞数据智能团队负责人尹越现场分享：尹越，有赞数据智能团队负责人，与团队成员一起承担有赞搜索、推荐、客服机器人、智慧零售、风控、会员营销等多场景的数智化建设的职责。大家好，我是来自有赞的尹越，今天主要和大家分享有赞数据智能团队在个性化推荐能力的演进与实践。我将首先介绍有赞公司和我们团队，其次是分享下我们从事的业务以及遇到的问题，最后聊下有赞推荐技术是如何逐步演进的。有赞数据智能团队有赞是一家零售科技服务公司，致力于协助商家经营移动社交电商和全渠道新零售，服务好每一个商家的上门客户。我所在的有赞数据智能团队曾负责线上场景的有赞微商城，现在负责线下零售，包括零售门店网店的有赞零售业务，涉及医美行业的有赞美业和涉及线下教育的有赞教育。有赞数据智能团队本身是一个直接面向业务的团队，我们的主要职责是负责引领有赞数据智能进程，涉及的业务包括推荐与搜索、风控、精准营销、智能...

2021-01-27

750

Spring Boot 使用 GraalVM 构建本文示例代码背景容器化、函数式、低代码、云原生各种概念和技术层出不穷，无奈，与时俱进，跟进研究，发现 Quarkus 最近比较火爆，抽空研究了一下，这就引出了本文的猪脚: GraalVM ，口号是:Run Programs Faster Anywhere 简介 GraalVM Native Image是由Oracle Labs开发的一种AOT编译器，支持基于JVM的高级语言，如Java, Scala, Clojure, Kotlin。Native Image以Java bytecode作为输入，将所有应用所需的class依赖项及runtime库打包编译生成一个单独可执行文件。具有高效的startup及较小的运行时内存开销的优势。与传统的Java虚拟机不同，Native Image是封闭式的静态分析和编译，不支持class的动态加载，程序运行所需要的多有依赖项均在静态分析阶段完成。此外GraalVM Native Image运行在一个名为SubstrateVM的轻量级的虚拟机之上。虽说是轻量级虚拟机，SubstrateVM却拥有运...

2021-01-27

647

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。