查看: 113|回复: 4

关于CPU GPU共享内存的问题

[复制链接]

2

主题

4

帖子

36

积分

办事员

Rank: 1

积分
36
发表于 2020-5-26 10:21:17 | 显示全部楼层 |阅读模式
Hello,
我们在Apex上跑自己的模型的时候,统计了数据从GPU到CPU的时间(device to host)用时150ms,远比预期中要长。之前有听说过Apex是CPU与GPU共享内存的,不清楚这方面可不可以给一些具体的建议或者说明呢?


回复

使用道具 举报

23

主题

36

帖子

382

积分

超级版主

Rank: 8Rank: 8

积分
382
发表于 2020-5-27 11:01:04 | 显示全部楼层
请问您是怎么怎么把数据从(device to host)的?设备正常的memory copy应该是几个ms内的
回复

使用道具 举报

8

主题

42

帖子

162

积分

科员

Rank: 2

积分
162
发表于 2020-5-27 19:57:04 | 显示全部楼层
请问是否有最小的sample code呢?
一般进行inference的时候只有一张图片的大小,不可能耗时这么长的。

感觉像是代码有什么问题。
回复

使用道具 举报

2

主题

4

帖子

36

积分

办事员

Rank: 1

积分
36
 楼主| 发表于 2020-5-28 09:27:54 | 显示全部楼层
找到问题了,是用cuda的时候里面主机同步有个地方有bug,改正了就好了~谢谢!
回复

使用道具 举报

5

主题

12

帖子

65

积分

科员

Rank: 2

积分
65
发表于 2020-5-29 11:44:39 | 显示全部楼层
Eralien 发表于 2020-5-28 09:27
找到问题了,是用cuda的时候里面主机同步有个地方有bug,改正了就好了~谢谢! ...

您好,我也有类似问题,请问您的bug是什么呢?方便共享或者讲解下吗
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 点我注册

本版积分规则


快速回复 返回顶部 返回列表