快捷导航
Hello,
我们在Apex上跑自己的模型的时候,统计了数据从GPU到CPU的时间(device to host)用时150ms,远比预期中要长。之前有听说过Apex是CPU与GPU共享内存的,不清楚这方面可不可以给一些具体的建议或者说明呢?


举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-5-29 11:44

大米力 超级版主 发表于 2020-5-27 11:01 | 显示全部楼层
请问您是怎么怎么把数据从(device to host)的?设备正常的memory copy应该是几个ms内的
米米米 版主 发表于 2020-5-27 19:57 | 显示全部楼层
请问是否有最小的sample code呢?
一般进行inference的时候只有一张图片的大小,不可能耗时这么长的。

感觉像是代码有什么问题。
Eralien 会员 发表于 2020-5-28 09:27 | 显示全部楼层
找到问题了,是用cuda的时候里面主机同步有个地方有bug,改正了就好了~谢谢!
xuxu 游客 发表于 2020-5-29 11:44 | 显示全部楼层
Eralien 发表于 2020-5-28 09:27
找到问题了,是用cuda的时候里面主机同步有个地方有bug,改正了就好了~谢谢! ...

您好,我也有类似问题,请问您的bug是什么呢?方便共享或者讲解下吗
您需要登录后才可以回帖 登录 | 点我注册

精彩推荐

  • MIIVII EVO ORIN的最新镜像中米文的源报404
  • 求助,储存空间不够,如何解决
  • APEX AD 10问题见图片
  • 相机启动launch
  • APEX AD-10 GPS授时修改串口波特率

明星用户