zynq 的PS 共享给PL端的CLK 性能上不去比较奇怪 (amobbs.com 阿莫电子技术论坛) -

ackyee 发表于 2022-3-7 11:05:25

zynq 的PS 共享给PL端的CLK 性能上不去比较奇怪

本帖最后由 ackyee 于 2022-3-7 11:13 编辑

1. PL端的逻辑接外部50M 有源晶振，内部可以MMCM倍频到200M 跑图像处理没问题
2. PL端的逻辑时钟接 PS（CLK 0）-->50m -->MMCM到 200M 竟然工作异常了，降低频率到150M 才工作正常
3. PL端的逻辑时钟接 PS（CLK 1）-->50m -->MMCM到 200M 竟然工作异常了，降低频率到150M 也不能正常工作，需要继续降低频率（和情况2比这里PS 从时钟的口2引出）

接内部PS引出时钟的时候，时序约束好像不能对这个时钟进行约束

这个是正常的吗？还是我这边多级倍频不符合设计规范的

因为后面可能会增加展频而PS端的PLL不能增加这部分功能，所以 PS端的时钟输出还得接 PL端的MMCM

下一步试试看调整PS端 CLK 的输出模式，调整不同的频率，切换IO PLL DDR PLL ARM PLL 看看效果

ackyee 发表于 2022-3-7 11:15:00

刚出来新的结果把PS端的PLL 从 IO PLL 更换成 DDR PLL 后，PL端的时钟可以上升到160M 了，继续往上调看看，看来IO PLL 和DDR PLL 还是有区别的

wye11083 发表于 2022-3-7 12:10:01

你配完有没有validate bd？我用了z7和zu+从来没有遇到你这情况，而且我频率都打到250mhz了。。pll没问题，但是你一定要看zynq配置页面的实际时钟。还有，复位拉好。

ackyee 发表于 2022-3-7 15:15:28

本帖最后由 ackyee 于 2022-3-7 15:20 编辑

wye11083 发表于 2022-3-7 12:10
你配完有没有validate bd？我用了z7和zu+从来没有遇到你这情况，而且我频率都打到250mhz了。。pll没问题， ...
(引用自3楼)

复位信号都有拉的，我做的大面积卷积，多重卷积合并，原先的板子上 50M外部晶振可以正常工作

现在用PS 共享出来的时钟，计算出来的结果图像是有整个是乱的，不明白时钟更换了源频率一样的情况下为什么会有影响(fpga 同型号同平台，同速度等级，板不同)，而且200-150M相差的还挺多的

下面打算优化下图像处理部分，看看能不能够通过优化逻辑，再提高速度

wye11083 发表于 2022-3-7 16:47:00

ackyee 发表于 2022-3-7 15:15
复位信号都有拉的，我做的大面积卷积，多重卷积合并，原先的板子上 50M外部晶振可以正常工作

现在 ...
(引用自4楼)

卷积的话你注意内存带宽是不是爆掉了，需要加stall状态。小核大数据读写容易爆，大核小数据容易喂不饱。时钟的话约束是自动做的，你pr之后会有输出，仔细看看timing是不是有问题。还有就是内存是不是不稳定，比如我用7a200t跑432M乘法器内存1066时数据大部分异常，降到800就正确了。

另外，比较重要的一点，如果内核供电上不去的话，也会出错。576个DSP跑432M功耗大约能打到20W，内核供电必须得能提供30A以上的稳定持续电流才能保障可靠性。具体看你power estimator结果。

ackyee 发表于 2022-3-7 20:35:45

wye11083 发表于 2022-3-7 16:47
卷积的话你注意内存带宽是不是爆掉了，需要加stall状态。小核大数据读写容易爆，大核小数据容易喂不饱。 ...
(引用自5楼)

对哦你说的功耗上的问题，我确实没有注意过，我明天去看一眼功耗电源芯片确实有删减过换成功率更低的但是应该也是有余量的

wye11083 发表于 2022-3-7 21:02:14

ackyee 发表于 2022-3-7 20:35
对哦你说的功耗上的问题，我确实没有注意过，我明天去看一眼功耗电源芯片确实有删减过换成功率更 ...
(引用自6楼)

我给7a200留的是30a供电，实际跑起来之后热得一匹，加个散热片+小风扇都65度。

ackyee 发表于 2022-3-7 21:31:06

wye11083 发表于 2022-3-7 21:02
我给7a200留的是30a供电，实际跑起来之后热得一匹，加个散热片+小风扇都65度。 ...
(引用自7楼)

{:lol:} 我已经把算法优化了好多，一个DSP CORE 当两个乘法器用，可以同时计算两个卷积{:dizzy:}

明天试试看把频率加上去的时候各路电源波形是否还稳定

ackyee 发表于 2022-3-7 21:33:10

wye11083 发表于 2022-3-7 16:47
卷积的话你注意内存带宽是不是爆掉了，需要加stall状态。小核大数据读写容易爆，大核小数据容易喂不饱。 ...
(引用自5楼)

对哦你说的功耗上的问题，我确实没有注意过，我明天去看一眼功耗电源芯片确实有删减过换成功率更低的但是之前看过好像是完全有余量的

wye11083 发表于 2022-3-7 23:10:39

ackyee 发表于 2022-3-7 21:31
我已经把算法优化了好多，一个DSP CORE 当两个乘法器用，可以同时计算两个卷积

明 ...
(引用自8楼)

8 bit精度不好处理。另外累加也挺费资源+费电。我是io 108m，core 216m，dsp 432m，跑16bit，直接4/12bit量化之后跟float精度相差无几。

页: [1]

amobbs.com 阿莫电子技术论坛's Archiver

zynq 的PS 共享给PL端的CLK 性能上不去 比较奇怪

zynq 的PS 共享给PL端的CLK 性能上不去比较奇怪