机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 3235|回复: 4
打印 上一主题 下一主题

cuda优化参考

[复制链接]
跳转到指定楼层
楼主
发表于 2012-3-31 19:55:42 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
http://www.cppblog.com/hktk/category/11855.html
cuda优化参考,很有价值
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

沙发
发表于 2012-3-31 20:05:37 | 只看该作者
我看了第五章<第二个cuda程序>写得很好啊!

继续学习下。应该是台湾人写的。
回复 支持 反对

使用道具 举报

板凳
发表于 2012-3-31 20:06:35 | 只看该作者
cudaMallocPitch
cudaMemcpy2D

我们第二个版本要采用二维来做,对齐应该也会提高效率。
回复 支持 反对

使用道具 举报

地板
 楼主| 发表于 2012-3-31 20:51:42 | 只看该作者
xmubingo 发表于 2012-3-31 20:06
cudaMallocPitch
cudaMemcpy2D

恩,对shared内存运用基本到极限了,另外的提升看来要从算法和其他一些地方入手了
回复 支持 反对

使用道具 举报

5#
发表于 2012-3-31 21:59:22 | 只看该作者
很不错的学习资料,之前也想用二维的,但有些问题还没考虑清楚所以放弃了。继续优化~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2025-4-5 09:07 , Processed in 0.083129 second(s), 18 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表