本月博客排行
-
第1名
龙儿筝 -
第2名
johnsmith9th -
第3名
wy_19921005 - zysnba
- sgqt
- lemonhandsome
年度博客排行
-
第1名
宏天软件 -
第2名
青否云后端云 -
第3名
龙儿筝 - gashero
- wallimn
- vipbooks
- benladeng5225
- wy_19921005
- fantaxy025025
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- javashop
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- gaojingsong
- wiseboyloves
- xiangjie88
- ranbuijj
- ganxueyun
- sichunli_030
- xyuma
- wangchen.ily
- jh108020
- lemonhandsome
- zxq_2017
- jbosscn
- Xeden
- luxurioust
- lzyfn123
- zhanjia
- forestqqqq
- johnsmith9th
- ajinn
- nychen2000
- wjianwei666
- hanbaohong
- daizj
- 喧嚣求静
- silverend
- mwhgJava
- kingwell.leng
- lchb139128
- lich0079
- kristy_yy
最新文章列表
CUDA warp divergence与bank conflict
1.Warp Divergence
warp是SM的基本执行单元。一个warp包含32个并行thread,这32个thread执行于SMIT模式。也就是说所有thread 执行同一条指令,并且每个thread会使用各自的data执行该指令。
因为所有同一个warp中的thread必须执行相同的指令,那么如果这些线程在遇到控制流语句时,如果进入不同的分支,那么同一时刻除了正在执行的 ...
CUDA-从GPU结构理解线程
原文地址:
http://blog.csdn.net/sunmc1204953974/article/details/51074102
在使用GPU线程时不是线程越多就越好,其实从硬件角度分析,支持CUDA的NVIDIA 显卡,都是由多个multiprocessors 组成。每个 multiprocessor 里包含了8个stream processors,其组成是四个四 ...
CUDA--Unified Memory
在我们编写CUDA程序时我们经常要对CPU和GPU上分配内存和管理,这样就增加了编写程序发复杂度。在cuda6后引入了统一寻址(Unified Memory)技术,该技术使得CPU和GPU使用同一个指针对同一块内存进行处理,省去了原始的在CPU和CPU分配内存然后来回拷贝的过程,简化了程序的编写。
统一寻址创建了一块托管内存(managed memory),这是在CPU和 ...
CUDA-aware MPI
现在越来越多的高性能并行计算将MPI与GPU结合起来:MPI的将任务并行分发,CUDA进行并行计算。大大提高了并行效率。然而我们知道在GPU上进行计算时常常出现数据重CPU到GPU或从GPU到CPU的拷贝过程,在数据量大的情况下这种拷贝过程往往会花费很多时间。因此英伟达公司实现了一种新的技术:CUDA-aware MPI。改技术实现了GPU缓存的直接访问,这样就很好地避免了在使用MPI+ ...
CUDA—两个数组相加
使用CUDA实现两个数组的相加,熟悉CUDA相关函数的使用。
#include <cuda_runtime.h>
#include <stdio.h>
__global__ void addKernel( int* c, const int* a, const int* b )
{
int i = threadIdx.x;
...
Ubuntu15.04 安装Geforce显卡驱动和CUDA
机器配置
i5-6500 + Geforce 9xx
Ubuntu 15.04 + CUDA 7.5
唯一难题
Ubuntu booting into console mode:
No need to change "/etc/default/grub" file or execute "sudo update-grub"
JUST execute &qu ...
使Visual Assist X支持CUDA的.cu文件的代码提示
现在安装CUDA很方便了,直接支持Visual Studio。但代码提示很烂!!!
具体方法参见:http://www.myexception.cn/cuda/1266303.html
这里简单记录一下使Visual Assist X支持.cu文件代码提示的步骤:
1、Visual Assist选项中添加CUDA头文件路径
2、修改使Visual Assist的注册表,将.cu文件添加到 ...
CUDA程序block和thread超出硬件允许值时的异常
调用CUDA的核函数时指定block 和 thread大小,该大小可以是dim3类型的(三维数组),只用一维时可以是usigned int型的。
以下程序验证了当block或thread大小超出硬件允许值时会产生异常!!!GPU根本不会执行运算!!!
所以验证结果的正确性很重要!!!
在VS中创建CUDA项目会有一个模板,里面有更详细的状态验证。
以下程序在K5000GPU上跑的。
奇怪的是cu ...
Between SISD and SIMD: a bridge not too far
GPGPU, since its emerge in 2007 by nVidia, has been continuously changing the paradigm of software/hardware computing. It has already been proven to be a very competitive candidate in supercomputing, c ...
CUDA 5 Release Candidate Now Available
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced features ...