arm neon相关arm指令优化问题
本帖最后由 titer1 于 2013-3-26 10:35 编辑学习这方面有没有好的书推荐?
第二,验证优化必须用板上运行吗,可以用qume搞定吗
如上,谢谢 实际操作没有过,不知是否可以看下gcc的优化方式.
qemu能支持到A15,应该可以至少做些判断? linucos 发表于 2013-3-26 12:14
实际操作没有过,不知是否可以看下gcc的优化方式.
qemu能支持到A15,应该可以至少做些判断? ...
嗯,刚看了arm的neon whitepaper, 觉得就是在循环,尤其次数比较多的循环,或某些结构体赋值时,优化一下 Neon主要提供了浮点和SIMD两个事情。
SIMD优化看X86或者PPC相关的SIMD优化效果是一样的。只不过最后需要结合ARM Core以及Neon的流水线结构进行处理。
软件仿真可以初步验证效果,但是精微的调整必须上硬件并且用Trace工具。
软仿的模型粒度一般不够细,具体的流水线情况以及内存/总线/总线矩阵情况是仿不出来的。仿的好的上了硬件还会有小出入。
不过不是专门做IP的公司,没太大必要搞这种精密到指令序列级的优化。
大致这样,供参考。 dr2001 发表于 2013-3-26 16:25
Neon主要提供了浮点和SIMD两个事情。
SIMD优化看X86或者PPC相关的SIMD优化效果是一样的。只不过最后需要结 ...
嗯,谢谢这么细致的分析
页:
[1]