titer1 发表于 2013-3-26 10:32:15

arm neon相关arm指令优化问题

本帖最后由 titer1 于 2013-3-26 10:35 编辑

学习这方面有没有好的书推荐?

第二,验证优化必须用板上运行吗,可以用qume搞定吗

如上,谢谢

linucos 发表于 2013-3-26 12:14:58

实际操作没有过,不知是否可以看下gcc的优化方式.
qemu能支持到A15,应该可以至少做些判断?

titer1 发表于 2013-3-26 16:08:52

linucos 发表于 2013-3-26 12:14
实际操作没有过,不知是否可以看下gcc的优化方式.
qemu能支持到A15,应该可以至少做些判断? ...

嗯,刚看了arm的neon whitepaper, 觉得就是在循环,尤其次数比较多的循环,或某些结构体赋值时,优化一下

dr2001 发表于 2013-3-26 16:25:32

Neon主要提供了浮点和SIMD两个事情。
SIMD优化看X86或者PPC相关的SIMD优化效果是一样的。只不过最后需要结合ARM Core以及Neon的流水线结构进行处理。

软件仿真可以初步验证效果,但是精微的调整必须上硬件并且用Trace工具。
软仿的模型粒度一般不够细,具体的流水线情况以及内存/总线/总线矩阵情况是仿不出来的。仿的好的上了硬件还会有小出入。
不过不是专门做IP的公司,没太大必要搞这种精密到指令序列级的优化。

大致这样,供参考。

titer1 发表于 2013-3-26 21:56:23

dr2001 发表于 2013-3-26 16:25
Neon主要提供了浮点和SIMD两个事情。
SIMD优化看X86或者PPC相关的SIMD优化效果是一样的。只不过最后需要结 ...

嗯,谢谢这么细致的分析
页: [1]
查看完整版本: arm neon相关arm指令优化问题