额滴神哪，IAR的编译器也太强悍了吧，居然会做出这种优化 (amobbs.com 阿莫电子技术论坛) -

Scarlette 发表于 2008-8-3 15:53:36

额滴神哪，IAR的编译器也太强悍了吧，居然会做出这种优化

一段初始化代码：
PUINT16 FrontSurface;
PUINT16 BackSurface;
UINT32Offset;

...

Offset = 160;
do
{
   *--FrontSurface = 0;
   *--BackSurface = 0x720;
} while (--Offset);

编译之后看了一下list，发现看不明白它啥意思：
   MOVS R2,#+40
   MOVS R3,#+228
   LSLS R3,R3,#+3    ;; #+1824
   MOVS R5,#+0
??Initialize_1:
   SUBS R0,R0,#+2
   STRH R5,
   SUBS R4,R4,#+2
   STRH R3,
   SUBS R0,R0,#+2
   STRH R5,
   SUBS R4,R4,#+2
   STRH R3,
   SUBS R0,R0,#+2
   STRH R5,
   SUBS R4,R4,#+2
   STRH R3,
   SUBS R0,R0,#+2
   STRH R5,
   SUBS R4,R4,#+2
   STRH R3,
   SUBS R2,R2,#+1
   BNE    ??Initialize_1

跟踪了一把，才明白过来，它的意思是：

Offset = 40;
do
{
   *--FrontSurface = 0;
   *--BackSurface = 0x720;
   *--FrontSurface = 0;
   *--BackSurface = 0x720;
   *--FrontSurface = 0;
   *--BackSurface = 0x720;
   *--FrontSurface = 0;
   *--BackSurface = 0x720;
} while (--Offset);

只好膜拜一下……

guantingwei 发表于 2008-8-3 16:03:37

你可以禁止对loop的优化啊

Scarlette 发表于 2008-8-3 16:06:24

其实倒不是说嫌它优化loop不好，只不过是它的优化方式有点太出乎意料了

makesoft 发表于 2008-8-3 16:25:59

优化的不错，速度比简单的(FOR...NEXT)应该快很多。

IAR就是IAR啊

jiahanxiao 发表于 2008-8-17 13:06:57

确实牛

chunjiu 发表于 2008-8-17 13:35:56

不错！不过似乎这是 ARM 核的标准代码，在很多不同产品的源代码中都见到过。相对于老型号的 CPU 核，ARM 核有 4 个自由寄存器替代了老型号的 CPU 的一个累加器，所以代码在最大程度上利用这些寄存器，使执行效率提高了很多倍。

在 ARM7 的内核中，它的优势很明显：减少了跳转，降低了代码预取机构的刷新次数，使代码执行效率提高了很多。

myxiaonia 发表于 2015-5-16 21:00:55

循环展开啊挺智能

abutter 发表于 2015-5-18 14:22:25

Loop unrolling

silence_sky 发表于 2015-5-18 14:37:28

循环展开
搜了一下，意思是通过展开，减少跳转次数，降低分支对流水线的打断，提高速度？

love_zjb 发表于 2015-5-21 13:31:51

Loop unrolling
循环展开

10xjzheng 发表于 2015-10-12 12:01:36

厉害，我居然看懂了

页: [1]

amobbs.com 阿莫电子技术论坛's Archiver

额滴神哪，IAR的编译器也太强悍了吧，居然会做出这种优化