<?xml version="1.0" encoding="gbk"?>
<rss version="2.0">
  <channel>
    <title>机器学习和生物信息学实验室联盟 - CUDA高性能运算</title>
    <link>http://123.57.240.48/forum.php?mod=forumdisplay&amp;fid=73</link>
    <description>Latest 20 threads of CUDA高性能运算</description>
    <copyright>Copyright(C) 机器学习和生物信息学实验室联盟</copyright>
    <generator>Discuz! Board by Comsenz Inc.</generator>
    <lastBuildDate>Mon, 20 Apr 2026 14:03:05 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>http://123.57.240.48/static/image/common/logo_88_31.gif</url>
      <title>机器学习和生物信息学实验室联盟</title>
      <link>http://123.57.240.48/</link>
    </image>
    <item>
      <title>记一次CUDA编程任务</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1428</link>
      <description><![CDATA[这个月6号开始，着手解决一个具有实际意义的计算任务，这里简单记录一下，供CUDA初学者参考，大神勿喷。

任务数据有9879896条，每条包含30个整数，任务是计算每两条数据之间的斯皮尔相关系数及其P值。原始数据只有500+MB，因此我并不认为这是个多么大的计算任务。随 ...]]></description>
      <category>CUDA高性能运算</category>
      <author>shixiang</author>
      <pubDate>Thu, 16 Feb 2017 02:43:06 +0000</pubDate>
    </item>
    <item>
      <title>单显卡写CUDA程序，解除5s运行时间限制</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1425</link>
      <description><![CDATA[在写CUDA程序时，如果电脑只有一块N卡，那么windows操作系统下会有一个运行时间限制，官方说大概是5s左右（Linux下未知）。

以下是CUDA官方问答页面里的中文原文：



通过增加注册表字段，可以解除这个时间限制，代价是在CUDA程序运行时显示器不会响应鼠标键盘 ...]]></description>
      <category>CUDA高性能运算</category>
      <author>shixiang</author>
      <pubDate>Sun, 12 Feb 2017 02:50:05 +0000</pubDate>
    </item>
    <item>
      <title>稀疏矩阵-稀疏矩阵乘法</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1017</link>
      <description><![CDATA[论文：
http://vdisk.weibo.com/s/z7KRAPr8PzhWd]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Sat, 03 May 2014 03:30:30 +0000</pubDate>
    </item>
    <item>
      <title>CUDA培训教材</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=934</link>
      <description><![CDATA[这是上次培训使用的教材，还有一些培训视频我就放实验室306，要看的同学可以过去拿。]]></description>
      <category>CUDA高性能运算</category>
      <author>花思谢</author>
      <pubDate>Tue, 16 Jul 2013 15:48:25 +0000</pubDate>
    </item>
    <item>
      <title>Hadoop和CUDA的联合，有人试试么？</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=689</link>
      <description><![CDATA[这个有个例子，他们应该搞定了。

Hadoop + CUDA
http://wiki.apache.org/hadoop/CUDA%20On%20Hadoop]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Mon, 24 Sep 2012 02:28:05 +0000</pubDate>
    </item>
    <item>
      <title>NVIDIA官方技术论坛已对外开放！</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=658</link>
      <description><![CDATA[http://cudazone.nvidia.cn/forum/forum.php]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Tue, 14 Aug 2012 06:20:54 +0000</pubDate>
    </item>
    <item>
      <title>解读SM, SP和Warp</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=655</link>
      <description><![CDATA[经常在阅读文档的时候会遇到这些名词。一般他们都会以tesla架构为例子，比如teslaC1060也就是1个SM有8个SP.

我的总结：
1. 一个显卡(GPU)里有多个(Streaming Multiprocessor)SM, 每个SM中有多个(Streaming processor)SP。
2. 一个SM会负责多个ThreadBlock(线程块) ...]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Mon, 13 Aug 2012 08:18:29 +0000</pubDate>
    </item>
    <item>
      <title>《深入浅出谈CUDA》- PDF</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=652</link>
      <description><![CDATA[这个文档写得很好。

里边有两个版本，一个是别人整理的，一个是我直接从网页上转成pdf的。

目录：
· CUDA简介
· 安装CUDA
· 第一个CUDA程序
· 改良第一个程序
· 第二个CUDA程序
· GPU的已经架构]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Sat, 11 Aug 2012 02:05:19 +0000</pubDate>
    </item>
    <item>
      <title>CUDA在Nvidia官网的不同入口</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=650</link>
      <description><![CDATA[一个是http://www.nvidia.com/object/cuda_home_new.html
另一个是http://developer.nvidia.com/category/zone/cuda-zone

我们暂且把他们称作www开头和dev开头。

www点击cuda zone得到的cuda toolkit和dev点击cuda toolkit得到的内容不一致。

根据比较。显然d ...]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Wed, 08 Aug 2012 06:17:30 +0000</pubDate>
    </item>
    <item>
      <title>CUDA读物（第二波）</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=649</link>
      <description><![CDATA[学习材料选自
http://developer.nvidia.com/cuda/gpu-computing-webinars
http://developer.nvidia.com/cuda/nvidia-gpu-computing-documentation

CUDA入门



程序优化
1. 存储优化



share memory优化视频，太小气了，没PPT
http://developer.downloa ...]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Tue, 07 Aug 2012 13:11:19 +0000</pubDate>
    </item>
    <item>
      <title>单机多卡CUDA编程解决方案</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=648</link>
      <description><![CDATA[关键词：Devices, Streams, Events, UVA, P2P.





CUDA支持卡间通讯，比如引用另一张卡上的内存。还可以进行卡间计算同步。

当然，我们实现过多线程，每个线程控制一张卡计算的实例。]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Tue, 07 Aug 2012 12:57:39 +0000</pubDate>
    </item>
    <item>
      <title>CUDA Libraries简介</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=647</link>
      <description><![CDATA[官方PPT，做得很好。

GPU-Accelerated Libraries

cuFFT, – Fast Fourier Transforms Library
cuBLAS – Complete BLAS library
cuSPARSE – Sparse Matrix library
cuRAND – Random Number Generator
NPP – Thousands of Performance Primitives for Image ...]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Tue, 07 Aug 2012 11:08:37 +0000</pubDate>
    </item>
    <item>
      <title>cuSPARSE - 针对稀疏矩阵</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=644</link>
      <description><![CDATA[根据介绍，cuSPARSE比intel MKL还快很多倍。和cuBLAS一样，具有三层计算结构，向量-向量，向量-矩阵，矩阵-矩阵。



http://developer.nvidia.com/cuda/gpu-accelerated-libraries
http://developer.nvidia.com/cuda/cusparse


同时，google code上也有个开源 ...]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Mon, 06 Aug 2012 06:40:41 +0000</pubDate>
    </item>
    <item>
      <title>CUDA与生物信息学</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=643</link>
      <description><![CDATA[CUDA在各个学科上的应用：
http://cudazone.nvidia.cn/cuda-action-research-apps/

CUDA在生物信息学上的应用：
http://www.nvidia.cn/object/bio_info_life_sciences_cn.html

CUDA与生物信息学的论文：
https://biomanycores.org/papers]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Mon, 06 Aug 2012 06:15:12 +0000</pubDate>
    </item>
    <item>
      <title>从Get start看CUDA发展趋势</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=642</link>
      <description><![CDATA[http://www.nvidia.com/content/cuda/get-started-parallel-computing.html



这是目前Nvidia认为CUDA应该的努力方向。

1. 和具体工作相结合。类似cuBLAS来优化数学库，cuFFT进行图形计算。

2. 以简化CUDA开发为目标。慢慢降低程序员对硬件的要求。

3. 不 ...]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Mon, 06 Aug 2012 03:06:17 +0000</pubDate>
    </item>
    <item>
      <title>OpenACC - 不学CUDA也可以用GPU做计算</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=641</link>
      <description><![CDATA[OpenACC是Nvidia和第三方开发的一个工具。

只要在你的C或者是Fortran代码中，加入相应的编译指令，OpenACC将自动并行化那些代码。




显然，目前它所能做的工作有限，底层挖掘并行化比较难。http://openacc.org/ 它的官网上显示，2012年4月出了1.0a版本。强烈 ...]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Mon, 06 Aug 2012 02:57:36 +0000</pubDate>
    </item>
    <item>
      <title>CUDA 5预览版已出，将直接支持Eclipse Nsight</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=640</link>
      <description><![CDATA[http://www.nvidia.com/content/cuda/cuda-toolkit.html



这样，在eclipse上开发，编译，debug，将不是难事。]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Mon, 06 Aug 2012 02:43:47 +0000</pubDate>
    </item>
    <item>
      <title>中科院CUDA集群方案</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=638</link>
      <description><![CDATA[]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Thu, 02 Aug 2012 07:39:04 +0000</pubDate>
    </item>
    <item>
      <title>清华大学CUDA课程</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=634</link>
      <description><![CDATA[非常好的PPT。深入浅出。]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Mon, 23 Jul 2012 02:54:13 +0000</pubDate>
    </item>
    <item>
      <title>[求助]矩阵求导相关问题</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=632</link>
      <description><![CDATA[求解释上面论文中第三页中

到

的推导过程？



以及，以下图片中第2步的解法：

上图的文本



 求助。。。。。。]]></description>
      <category>CUDA高性能运算</category>
      <author>xmubingo</author>
      <pubDate>Thu, 19 Jul 2012 13:02:30 +0000</pubDate>
    </item>
  </channel>
</rss>