`
love19820823
  • 浏览: 974510 次
文章分类
社区版块
存档分类
最新评论

Nvidia CUDA 3.0 更新

 
阅读更多

- Section 1.2
- Updated figure

添加了说明图,更好的解释了CUDA不只是一个语言,而是一个平台,一个platform,可以在CUDA之上可以架构其他语言平台,或则编程环境。CUDA有自己的ISA架构,有PTX代码,所以不要简单的把CUDA理解为是编程语言,可以根据CUDA的架构开发自己的芯片,或者硬件,当然,这个得要有详细的CUDA资料才行·~至少现在还不能。。。


- Section 2.5
- Mentioned the Fermi architecture

说明了Fermi是2.x的架构,在他之前的都是1.x的架构。Fermi算是一个进步吧。


- Section 3.1
- Heavily rewritten to clarify binary, ptx, application, C++ compatibility
- __noinline__ behaves differently for compute capability 2.0 and higher

介绍了NVCC和binary,ptx和应用程序,还有C++的关系;CUDA的kernel程序可以用CUDA的指令来写,这个类似汇编的指令就是PTX,PTX可以从它的手册里面找到更详细的介绍;

3.1.1 部分详细介绍了nvcc的编译过程,怎么把CU文件或者CUDA的程序编译成目标文件,怎么把C/C++语言的部分提交给C或者C++的编译器编译。

3.1.2 说明了二进制文件的情况,说明了code代表的意思,说明例如1.3的标示说明这个二进制的文件是在1.3的硬件或者之后的硬件上才能运行。

3.1.3 简单说明了一下PTX的指令一般都可以执行,但是有些指令只能在更高的硬件设备上才能执行;

3.1.4 说明了不同的版本的二进制文件和ptx代码,在将来的硬件上执行的情况,当然手册推荐采用PTX代码格式,以后就可以在运行的时候自动转义过去,这样就可以适应更新的特性,因为其实现在的一些硬件在编译一条ptx指令的时候,可能真正的在硬件方面其实使用了更多的指令,因为还不支持原生态的ptx指令,当以后的ptx指令可以一条执行的时候,就会发生变化,所以这个地方提出了说明;

3.1.5

说明了一些支持的C++的特性,不是所有的C++都能支持,可以在后面的附录中查到;


- Section 3.2
- Clarified that a CUDA context is created under the hood when initializing
the runtime and therefore CUDA resources are only valid in the context of
the host thread that initialized the runtime
- Updated graphics interoperability sections to new API

说明了现在的CUDA运行的每一个资源都在他的同一个context里面,这个后面也会说道,一个thread 控制一个GPU运行;


- Section 3.2.1
- Mentioned 40-bit address space for devices of compute capability 2.0

2.0的硬件设备有了40bit的寻址能力;


- Section 3.2.5.3
- Mentioned atomics to mapped page-locked memory

说明了page-locked的内存在原子操作跟从host或则其他设备来讲,并不是安全的原子操作;


- Section 3.2.6
- Added concurrent kernel execution and concurrent data transfer for devices
of compute capability 2.0

以前只能一次一次的执行kernel函数,现在可以一次执行多个kernel函数;


- Section 3.3
- Updated graphics interoperability sections to new API

后面部分就是一些新的函数
- New Section 3.4 about interoperability between runtime and driver APIs
- Chapter 4 and 5 mostly rewritten with additional information
- Part of appendix A moved to new appendices G with additional information
- Section B.1.4
- Mentioned that kernel parameters are passed via constant memory for
devices of compute capability 2.0
- Section B.6
- Added new functions __syncthreads_count(), __syncthreads_and(), and
__syncthreads_or()
- Section B.10
- Mentioned atomics to mapped page-locked memory
- Section B.11
- Added new functions __ballot()
- New Section B.12 on profiler counter function
- New Section B.14 on launch bounds
- Section C.1.1
- Updated error for some functions
- Updated based FMAD being fused for compute capability 2.0
- Section C.1.2
- atomicAdd works with single-precision floating-point numbers for devices
of compute capability 2.0
- Updated error for some functions
- Section C.2.1
- Added new functions
- Section C.2.2
- Added new functions
- New Section D.6 about classes with non virtual member functions for devices
of compute capability 2.0
- New appendix E for nvcc specifics (moved __noinline__, #pragma unroll to this
appendix and added __restrict)

注解:

3.0的更新期待一些新特性,但是总体变化不大,倒是3.0的guide比较不错,可以好好的坎坷chapter3,里面有很多很详细的讲解,有时间可以多看看那一部分。

PS:看了VS2010的广告,不禁感叹,谁又会是我的下一行code啦……

分享到:
评论

相关推荐

    CUDA 3.0 & Visual Studio 2008 完全安裝指南 Win7 32bit/64bit

    - CUDA driver:确保您的显卡驱动已更新至最新版本或与CUDA 3.0兼容。 - CUDA Toolkit:包含了编译器和库等核心组件。 - CUDA SDK:提供了示例代码和文档,帮助开发者快速上手。 #### 二、安装Visual Studio ...

    cuda3.0中文编程指南(130page)

    CUDA 3.0 支持一系列 NVIDIA GPU,包括 GeForce、Quadro 和 Tesla 系列产品。具体的支持情况可能会随时间变化,请参阅 NVIDIA 官方文档获取最新信息。 **附录 B C 语言扩展** CUDA 对 C 语言进行了一系列扩展,以...

    风辰翻译Cuda3.0 Programming Guide

    CUDA技术最初由NVIDIA开发,旨在利用GPU的强大并行处理能力来加速非图形相关的计算任务。随着GPU架构的发展以及CUDA编程模型的不断完善,GPU已经不仅仅局限于图形渲染,而是广泛应用于科学计算、深度学习、高性能...

    nvidia cuda-samples

    7. **动态并行性**:CUDA 3.0引入了动态并行性,允许GPU在运行时启动新的线程块,这在“dynamicParallelism”示例中得以体现。 8. **错误处理和调试**:CUDA编程中,正确处理错误和调试是必不可少的。CUDA-Samples...

    NVIDIA_CUDA_ProgrammingGuide3.0

    ### NVIDIA CUDA Programming Guide 3.0 知识点解析 #### 一、引言 - **从图形处理到通用并行计算**:CUDA 技术最初由 NVIDIA 开发,旨在利用图形处理器(GPU)的强大计算能力进行通用计算任务。GPU 传统上用于...

    cuda 编程指南 3.0

    CUDA编程指南3.0是NVIDIA为开发者提供的关于CUDA编程的详细教程,旨在帮助程序员充分利用GPU的并行计算能力。 在CUDA编程中,有几个核心概念和关键知识点: 1. **CUDA架构**:CUDA架构是由GPU和CPU组成的系统,...

    CUDA编程指南3.0中文版

    CUDA(Compute Unified Device Architecture)作为一种由NVIDIA公司开发的并行计算平台和编程模型,使得开发者能够利用GPU的强大计算能力来加速计算密集型任务。这一章节主要介绍了GPU如何从最初的图形渲染发展成为...

    [GPU编程]CUDA技术3.0

    CUDA 技术3.0是NVIDIA推出的一种用于GPGPU(通用图形处理单元)编程的框架,旨在利用GPU的强大计算能力加速非图形计算任务。CUDA利用C语言为基础的编程模型,使得开发者能够以熟悉的编程语法创建在GPU上运行的程序,...

    CUDA_C_Best_Practices_Guide

    CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。...CUDA3.0已经开始支持C++和FORTRAN。

    CUDA和CUDNN.txt

    CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。...CUDA3.0已经开始支持C++和FORTRAN。

    cuda_9.2.148_win10_network.exe

    cuda9.2.148 win10历史版本,注意版本号和系统 显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。...CUDA3.0已经开始支持C++和FORTRAN。

    CUDA编程指南3.0

    CUDA(Compute Unified Device Architecture)是NVIDIA推出的一种并行计算平台和技术,允许开发者利用GPU进行通用计算。CUDA编程指南3.0作为官方文档,提供了详尽的技术指导,帮助开发者理解和掌握CUDA编程的核心...

    mmdeploy-0.8.0-windows-amd64-cuda10.2-tensorrt8.2.3.0.zip

    mmdeploy-0.8.0-windows-amd64-cuda10.2-tensorrt8.2.3.0.zip是一款由mmlab(多媒体实验室)开发的用于深度学习模型部署的工具包,专为Windows操作系统设计,适用于AMD64架构,并且集成了CUDA 10.2和TensorRT 8.2....

    CUDA 5.0库(支持VS2008开发)

    CUDA 5.0库(支持VS2008开发),含32位和64位库。CUDA(Compute Unified Device Architecture... CUDA3.0已经开始支持 C++ 和 FORTRAN 。 计算行业正在从只使用CPU的“中央处理”向CPU与GPU并用的“ 协同处理 ”发展。

    cuda_8.0.61_GTX1060

    CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。...CUDA3.0已经开始支持C++和FORTRAN。

    CUDA最新中文开发文档3.0

    CUDA是Compute Unified Device Architecture的缩写,是NVIDIA公司推出的一种通用并行计算平台和编程模型,允许开发者利用NVIDIA的GPU进行大规模并行计算,极大地提高了计算效率。 ### 一、CUDA编程指南3.0概述 ###...

    TensorRT-8.2.3.0.Windows10.x86-64.cuda-11.4.cudnn8.2.zip

    TensorRT 8.2.3.0 版本是针对Windows 10操作系统设计的,同时支持CUDA 11.0至11.5的不同版本,提供了一个全面的解决方案,以满足不同计算环境的需求。 **1. CUDA 11.4 支持** CUDA(Compute Unified Device ...

    CUDA编程指南中文3.0

    ### CUDA编程指南中文3.0知识点解析 #### 一、导论 **1.1 从图形处理到通用并行计算** 随着计算机图形学的发展,图形处理单元(Graphics Processing Unit, GPU)最初是为渲染复杂的三维图像而设计的。然而,GPU的...

    A developer’s guide to parallel computing with GPUS 完整高清

    CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。...CUDA3.0已经开始支持C++和FORTRAN。

Global site tag (gtag.js) - Google Analytics