最新文章列表

CUDA warp divergence与bank conflict

1.Warp Divergence    warp是SM的基本执行单元。一个warp包含32个并行thread,这32个thread执行于SMIT模式。也就是说所有thread 执行同一条指令,并且每个thread会使用各自的data执行该指令。    因为所有同一个warp中的thread必须执行相同的指令,那么如果这些线程在遇到控制流语句时,如果进入不同的分支,那么同一时刻除了正在执行的 ...
孤狼18 评论(0) 有1549人浏览 2016-12-28 15:34

CUDA-设备属性

struct cudaDeviceProp { char name[256]; /**< 设备的ASCII标识 */ size_t totalGlobalMem; /**< 可用的全局内存量,单位字节 */ size_t totalConstMem; /**< 可用的常量内 ...
孤狼18 评论(0) 有858人浏览 2016-12-28 13:15

CUDA-寄存器使用

1.重要概念 存储带宽:在一定时间内从DRAM读出或写入的数据量 延迟:响应一个获取内存的请求所花费的时间,这个时间通常是上百个处理器周期 2.SM ...
孤狼18 评论(0) 有1889人浏览 2016-12-26 13:58

CUDA-从GPU结构理解线程

    原文地址:  http://blog.csdn.net/sunmc1204953974/article/details/51074102     在使用GPU线程时不是线程越多就越好,其实从硬件角度分析,支持CUDA的NVIDIA 显卡,都是由多个multiprocessors 组成。每个 multiprocessor 里包含了8个stream processors,其组成是四个四 ...
孤狼18 评论(0) 有3099人浏览 2016-09-18 10:41

CUDA--Unified Memory

      在我们编写CUDA程序时我们经常要对CPU和GPU上分配内存和管理,这样就增加了编写程序发复杂度。在cuda6后引入了统一寻址(Unified Memory)技术,该技术使得CPU和GPU使用同一个指针对同一块内存进行处理,省去了原始的在CPU和CPU分配内存然后来回拷贝的过程,简化了程序的编写。      统一寻址创建了一块托管内存(managed memory),这是在CPU和 ...
孤狼18 评论(0) 有1187人浏览 2016-09-13 13:40

CUDA-流

 页锁定内存:     cudaHostAlloc()分配页锁定内存,页锁定内存也称为固定内存或不可分页内存,它有一个重要的属性:操作系统将不会对这块内存分页并交换到磁盘上,从而确保了该内存始终驻留在物理内存中。 流:     cuda流用于任务的并行。任务并行性是指并行执行两个或多个不同的任务,而不是在大量数据上执行同一个任务的数据并行性。比如处理同一副图,你用一个流处理左边半张图片,再 ...
孤狼18 评论(0) 有1026人浏览 2016-09-08 13:32

CUDA-aware MPI

    现在越来越多的高性能并行计算将MPI与GPU结合起来:MPI的将任务并行分发,CUDA进行并行计算。大大提高了并行效率。然而我们知道在GPU上进行计算时常常出现数据重CPU到GPU或从GPU到CPU的拷贝过程,在数据量大的情况下这种拷贝过程往往会花费很多时间。因此英伟达公司实现了一种新的技术:CUDA-aware MPI。改技术实现了GPU缓存的直接访问,这样就很好地避免了在使用MPI+ ...
孤狼18 评论(0) 有3462人浏览 2016-06-26 15:22

CUDA—两个数组相加

使用CUDA实现两个数组的相加,熟悉CUDA相关函数的使用。 #include <cuda_runtime.h> #include <stdio.h> __global__ void addKernel( int* c, const int* a, const int* b ) { int i = threadIdx.x; ...
孤狼18 评论(0) 有1990人浏览 2016-05-24 13:00

Ubuntu15.04 安装Geforce显卡驱动和CUDA

机器配置 i5-6500 + Geforce 9xx Ubuntu 15.04 + CUDA 7.5 唯一难题 Ubuntu booting into console mode: No need to change "/etc/default/grub" file or execute "sudo update-grub" JUST execute &qu ...
erwinbarton 评论(0) 有969人浏览 2016-04-25 07:33

Ubuntu下CUDA(含GPU卡驱动)安装过程

OS:Ubuntu 12.04 (amd64) 如果是一个不带图形界面的server系统,就没有停掉lightdm这个图形界面管理器的步骤了。。。服务器上也不应该有这个东东。。。但是,照例还是要先确认有没有安装一些有冲突的开源驱动程序,包括nvidia自己的。。。 1.dpkg -l | grep nvidia 如果有先卸载 2. 删除之前所安装的nVidia驱动。 sudo apt-ge ...
zlr 评论(0) 有1884人浏览 2016-01-27 12:53

使Visual Assist X支持CUDA的.cu文件的代码提示

现在安装CUDA很方便了,直接支持Visual Studio。但代码提示很烂!!! 具体方法参见:http://www.myexception.cn/cuda/1266303.html 这里简单记录一下使Visual Assist X支持.cu文件代码提示的步骤: 1、Visual Assist选项中添加CUDA头文件路径 2、修改使Visual Assist的注册表,将.cu文件添加到 ...
cherishLC 评论(0) 有2301人浏览 2015-07-17 00:05

CUDA程序block和thread超出硬件允许值时的异常

调用CUDA的核函数时指定block 和 thread大小,该大小可以是dim3类型的(三维数组),只用一维时可以是usigned int型的。 以下程序验证了当block或thread大小超出硬件允许值时会产生异常!!!GPU根本不会执行运算!!! 所以验证结果的正确性很重要!!! 在VS中创建CUDA项目会有一个模板,里面有更详细的状态验证。 以下程序在K5000GPU上跑的。 奇怪的是cu ...
cherishLC 评论(0) 有3748人浏览 2015-07-13 11:32

OpenCL与GPU计算入门 译文

OpenCL与GPU计算入门 作者: Erik Smistad 译者: gashero 日期: 2015-05-26 标题原文: Getting started with OpenCL and GPU Computing 地址: http://www.thebigblob.com/g ...
gashero 评论(0) 有10608人浏览 2015-05-29 11:50

Between SISD and SIMD: a bridge not too far

GPGPU, since its emerge in 2007 by nVidia, has been continuously changing the paradigm of software/hardware computing. It has already been proven to be a very competitive candidate in supercomputing, c ...
lonelydove 评论(0) 有1019人浏览 2013-04-06 14:52

CUDA 5 Release Candidate Now Available

The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced features ...
aijuans 评论(0) 有1047人浏览 2012-08-17 12:14

返回cuda的世界

http://itis.grid.sjtu.edu.cn/blog/?p=171   这篇文章教你如何配置cuda环境,是我看到的最好的文章。看域名是上交的。
urey 评论(0) 有755人浏览 2011-02-11 15:46

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics