搜索
bottom↓
回复: 4

arm neon相关arm指令优化问题

[复制链接]

出0入0汤圆

发表于 2013-3-26 10:32:15 来自手机 | 显示全部楼层 |阅读模式
本帖最后由 titer1 于 2013-3-26 10:35 编辑

学习这方面有没有好的书推荐?

第二,验证优化必须用板上运行吗,可以用qume搞定吗

如上,谢谢

阿莫论坛20周年了!感谢大家的支持与爱护!!

你熬了10碗粥,别人一桶水倒进去,淘走90碗,剩下10碗给你,你看似没亏,其实你那10碗已经没有之前的裹腹了,人家的一桶水换90碗,继续卖。说白了,通货膨胀就是,你的钱是挣来的,他的钱是印来的,掺和在一起,你的钱就贬值了。

出0入0汤圆

发表于 2013-3-26 12:14:58 | 显示全部楼层
实际操作没有过,不知是否可以看下gcc的优化方式.
qemu能支持到A15,应该可以至少做些判断?

出0入0汤圆

 楼主| 发表于 2013-3-26 16:08:52 来自手机 | 显示全部楼层
linucos 发表于 2013-3-26 12:14
实际操作没有过,不知是否可以看下gcc的优化方式.
qemu能支持到A15,应该可以至少做些判断? ...

嗯,刚看了arm的neon whitepaper, 觉得就是在循环,尤其次数比较多的循环,或某些结构体赋值时,优化一下

出0入0汤圆

发表于 2013-3-26 16:25:32 | 显示全部楼层
Neon主要提供了浮点和SIMD两个事情。
SIMD优化看X86或者PPC相关的SIMD优化效果是一样的。只不过最后需要结合ARM Core以及Neon的流水线结构进行处理。

软件仿真可以初步验证效果,但是精微的调整必须上硬件并且用Trace工具。
软仿的模型粒度一般不够细,具体的流水线情况以及内存/总线/总线矩阵情况是仿不出来的。仿的好的上了硬件还会有小出入。
不过不是专门做IP的公司,没太大必要搞这种精密到指令序列级的优化。

大致这样,供参考。

出0入0汤圆

 楼主| 发表于 2013-3-26 21:56:23 来自手机 | 显示全部楼层
dr2001 发表于 2013-3-26 16:25
Neon主要提供了浮点和SIMD两个事情。
SIMD优化看X86或者PPC相关的SIMD优化效果是一样的。只不过最后需要结 ...

嗯,谢谢这么细致的分析
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片。注意:要连续压缩2次才能满足要求!!】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-10-3 05:26

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表