Scarlette 发表于 2008-8-3 15:53:36

额滴神哪,IAR的编译器也太强悍了吧,居然会做出这种优化

一段初始化代码:
    PUINT16 FrontSurface;
    PUINT16 BackSurface;
    UINT32Offset;

    ...

    Offset = 160;
    do
    {
      *--FrontSurface = 0;
      *--BackSurface = 0x720;
    } while (--Offset);

编译之后看了一下list,发现看不明白它啥意思:
      MOVS   R2,#+40
      MOVS   R3,#+228
      LSLS   R3,R3,#+3      ;; #+1824
      MOVS   R5,#+0
??Initialize_1:
      SUBS   R0,R0,#+2
      STRH   R5,
      SUBS   R4,R4,#+2
      STRH   R3,
      SUBS   R0,R0,#+2
      STRH   R5,
      SUBS   R4,R4,#+2
      STRH   R3,
      SUBS   R0,R0,#+2
      STRH   R5,
      SUBS   R4,R4,#+2
      STRH   R3,
      SUBS   R0,R0,#+2
      STRH   R5,
      SUBS   R4,R4,#+2
      STRH   R3,
      SUBS   R2,R2,#+1
      BNE      ??Initialize_1

跟踪了一把,才明白过来,它的意思是:

    Offset = 40;
    do
    {
      *--FrontSurface = 0;
      *--BackSurface = 0x720;
      *--FrontSurface = 0;
      *--BackSurface = 0x720;
      *--FrontSurface = 0;
      *--BackSurface = 0x720;
      *--FrontSurface = 0;
      *--BackSurface = 0x720;
    } while (--Offset);

只好膜拜一下……

guantingwei 发表于 2008-8-3 16:03:37

你可以禁止对loop的优化啊

Scarlette 发表于 2008-8-3 16:06:24

其实倒不是说嫌它优化loop不好,只不过是它的优化方式有点太出乎意料了

makesoft 发表于 2008-8-3 16:25:59

优化的不错,速度比简单的(FOR...NEXT)应该快很多。

IAR就是IAR啊

jiahanxiao 发表于 2008-8-17 13:06:57

确实牛

chunjiu 发表于 2008-8-17 13:35:56

不错!不过似乎这是 ARM 核的标准代码,在很多不同产品的源代码中都见到过。相对于老型号的 CPU 核,ARM 核有 4 个自由寄存器替代了老型号的 CPU 的一个累加器,所以代码在最大程度上利用这些寄存器,使执行效率提高了很多倍。

在 ARM7 的内核中,它的优势很明显:减少了跳转,降低了代码预取机构的刷新次数,使代码执行效率提高了很多。

myxiaonia 发表于 2015-5-16 21:00:55

循环展开啊挺智能

abutter 发表于 2015-5-18 14:22:25

Loop unrolling

silence_sky 发表于 2015-5-18 14:37:28

循环展开
搜了一下,意思是通过展开,减少跳转次数,降低分支对流水线的打断,提高速度?

love_zjb 发表于 2015-5-21 13:31:51

Loop unrolling
循环展开

10xjzheng 发表于 2015-10-12 12:01:36

厉害,我居然看懂了
页: [1]
查看完整版本: 额滴神哪,IAR的编译器也太强悍了吧,居然会做出这种优化