阅读更多

3顶
0踩

行业应用
NVIDIA公司今天宣布了新版GPU通用计算开发包CUDA 4.0,主要改进方向是简化并行编程,让更多开发人员能够将应用程序移植到GPU平台。

CUDA 4.0的三大主要特性包括:


- GPUDirect 2.0技术。GPUDirect 1.0主要用于高性能计算集群应用,方便不同节点之间的GPU相互联系,而GPUDirect 2.0则面向节点内应用,即多GPU并联系统。同一节点内的多块GPU可以不经过CPU、住内存,直接交换各自显存中的数据。






- 统一虚拟寻址(UVA)。简化通用计算编程中的寻址空间设计,开发者不需要再考虑CPU和各个GPU各自的内存空间,而是整合为一个统一的内存寻址空间,大大简化并行编程。


- Thrust C++模板高性能基元库。能够提供一系列开源C++并行算法和数据结构,这些内容能够让C++开发人员更轻松的使用CUDA编程。与使用标准模板库(STL)以及线程构件(TBB)时相比,Thrust中并行排序等算法的速度可提升5至100倍。


除此之外,CUDA 4.0的新特性还包括:

- MPI与CUDA应用程序相结合。当应用程序发出MPI收发调用指令时,例如OpenMPI等MPI软件可通过Infiniband接口自动收发显卡显存数据。

- GPU多线程共享。多个CPU主线程能够在一颗GPU上共享运行环境。

- 单CPU线程共享多GPU。一个CPU主线程可以访问系统内的所有GPU。

- 全新的NPP图像与计算机视觉库。

- 新增、改良的功能

  Visual Profiler中的自动性能分析功能

  Cuda-gdb中的新特性以及新增了对Mac OS的支持

  新增了对C++特性的支持,这些特性包括新建/删除以及虚拟等功能

  新版GPU二进制反汇编程序

CUDA 4.0在硬件上需要Fermi架构GPU才能够提供完整支持,操作系统方面则仍然支持Windows、Mac OS X、Linux等系统。3月4日起,CUDA注册开发者计划会员将可以免费下载CUDA Tool Kit 4.0 RC发布候选版。



  • 大小: 67.3 KB
  • 大小: 110.3 KB
  • 大小: 63 KB
  • 大小: 60.9 KB
  • 大小: 88.8 KB
  • 大小: 93.3 KB
  • 大小: 106 KB
  • 大小: 99.5 KB
来自: 驱动之家
3
0
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 简化并行开发NVIDIA宣布CUDA 4.0

    NVIDIA公司今天宣布了新版GPU通用计算开发包CUDA 4.0,主要改进方向是简化并行编程,让更多开发人员能够将应用程序移植到GPU平台。CUDA 4.0的三大主要特性包括:GPUDirect 2.0技术GPUDirect 1.0主要用于高性能计算...

  • 提高多GPU编程与执行效率 CUDA 4.0初探

    作者:中关村在线 濮元恺 第1页:CUDA 4.0提高多GPU效率  ● CUDA带给GPU行业无限可能  2007年可以说是GPU发展史上翻天覆地的一年,在这一年微软推出了DirectX 10 API标准,将传统的Pixel ...

  • CUDA 4.0真技术解析

    转载请注明出处为KlayGE游戏引擎,本文地址为http://www.klayge.org/?p=961 上周的帖子刚提到NVIDIA宣布了CUDA 4,昨天就收到NV的邮件说CUDA 4.0 RC可以下载了。developer注册用户可以从...

  • 【并行计算-CUDA开发】 NVIDIA Jetson TX1

    NVIDIA Jetson TX1是计算机视觉系统的SoM(system-on-module)解决方案。它组合了最新的NVIDIAMaxwell GPU架构,其具有ARM Cortex-A57 MPCore(Quad-Core)CPU族,实现性能与电源功耗的最大优化,满足下一代产品的....

  • CUDA C编程(三十八)CUDA调试

    内 核 调 试 使用cuda-gdb UDA的printf CUDA的assert工具 内 存 调 试 cuda-memcheck的编译 memcheck工具 racecheck工具

  • 第6章 并行编程模型及环境

    并行编程模型大多数以数据和任务(过程化的操作)为中心来命名。一个具体的并行应用往往使用了多种并行编程模型。并行编程模型是并行算法的基础,并行算法的具体实现依赖于软硬件支持的并行编程模型。

  • CUDA10.0官方文档的翻译与学习之编程接口

    cudac运行时 初始化 设备内存 共享内存 页锁主机内存 可移植内存 写合并内存 映射内存 异步并发执行 主机与设备间的并发执行 并发核执行 数据迁移与核执行重叠 并发数据传输 流 多设备系统 设备枚举...

  • CUDA相关

    cuda相关整理

  • TensorFlow 以及 cuda 和 cudnn 的环境配置问题

    一、首先要搞清楚的问题 1) 关于显卡驱动 ...NVIDIA 驱动,因为CUDA Toolkit本地安装包内含特定版本Nvidia显卡驱动,下面安装 cuda 中可以选择更新显卡驱动】 显卡驱动版本一定不能低,而且支持向后兼容

  • 多CPU程序开发: OpenMP-MPI(机群)和CUDA(GPU)

    从应用的角度看,如何运用好GPU的并行计算能力主要的工作是开发好它的驱动程序。GPU驱动程序的优劣很大程度左右了GPU实际性能的发挥。 因此从微架构上看,CPU擅长的是像操作系统、系统软件和通用应用程序这类拥有...

  • 1.cuBLAS开发指南中文版--简介

    cuBLAS 库是 BLAS(基本线性代数子程序)在 NVIDIA®CUDA™ 运行时之上的实现。它允许用户访问 NVIDIA 图形处理单元 (GPU) 的计算资源。cuBLAS API,在本文档中简称为 cuBLAS API(从 CUDA 6.0 开始),(从 CUDA ...

  • 第9章 多GPU编程

    多GPU管理; 跨多GPU执行核函数; GPU间的叠加计算和通信;...使用CUDA-aware MPI交换数据; 使用GPU Direct RDAM的CUDA-aware MPI交换数据; 跨GPU加速集群扩展应用程序; 理解CPU和GPU的亲和性;

  • 3. CUDA编程手册中文版---编程接口

    CUDA C++ 为熟悉 C++ 编程语言的用户提供了一种简单的途径,可以轻松编写由设备执行的程序。 它由c++语言的最小扩展集和运行时库组成。 编程模型中引入了核心语言扩展。它们允许程序员将内核定义为 C++ 函数,并在...

  • 利用ASP嵌套JS+SQL Server打造两级连动下拉框(二)

                   利用ASP嵌套JS+SQL Server打造两级连动下拉框(2)TwoLevel.asp http-equiv="Content-Type" content="text/html; charset=gb2312"> name="GENERATOR" content="Microsoft FrontPage 4.0"> name="ProgId"

  • 利用ASP嵌套JS+SQL Server打造两级连动下拉框(一)

    利用ASP嵌套JS+SQL Server打造两级连动下拉框(1) 随着网络技术的迅速发展,越来越多的电子商务网站也应运而生。而在构建一个功能强大的电子商务网站往往少不了提供网上注册功能给客户自行注册这个模块,为了尽可能方便客户填写信息,我们经常要用到下拉框供客户选择,特别是两级连动下拉框最为常用。再说,本人今日发现CSDN论坛上也经常有网友提问这个问题,就是,需要一个两级连动下拉框,第

  • ASP+SQL Server之图象数据处理

    ASP+SQL Server之图象数据处理 ASP(Active Server Pages)是Microsoft很早就推出的一种WEB应用程序解决方案,也是绝大多数从事网站开发人员很熟悉的一个比较简单的编程环境。通过ASP我们可以创建功能强大的动态的WEB应用程序。ASP虽然功能很强大,但有些功能用纯ASP代码完成不了,为了能保证开发出功能更加强大的WEB应用程序,我们可以借助调用COM组

  • 用VB编写组件—封装数据库的连接字符串

    使用VB6编写组件隐藏数据库的连接字符串海南省商贸信息服务中心  温大文  如今,开发WEB应用程序绝大多数都是使用Browser/Server模式,而在B/S 应用程序开发领域中,微软公司的IIS/ASP组合以其强大的功能、良好的扩展能力及与其它微软产品良好的兼容性,迅速地流行起来。ASP以其简单易学、功能强大而博得广大程序员的喜爱,国内的大部分网站都是利用ASP架构的。

  • 通过ADO连接各种数据库的字符串翠集(二)(完)

       通过ADO连接各种数据库的字符串翠集海南省信息服务中心  温大文 ( (接上篇)二 二、接下来讲使用OLE DB来连接数据库的例子。1)  OLE DB Provider for Active Directory ServiceDim oConn,strConnSet oConn=Server.CreateObject(“ADODB.Con

  • 通过ADO连接各种数据库的字符串翠集(一)

    通过ADO连接各种数据库的字符串翠集海南省信息服务中心  温大文 在网络编程过程中,ADO(Activex Data Object)编程往往是不可少的工作,特别是开发电子商务网站。既然讲到ADO数据对象,那么就顺便简单地介绍一下ADO数据对象及其功能。ADO数据对象共有七种独立的对象,他们分别是连接对象(Connection)、记录集对象(RecordSet)、域对象(Fiel

  • 使用W3 JMail实现邮件发送的解决方案(1)

    使用W3 JMail实现邮件发送的解决方案海南省商贸信息服务中心  温大文                                                                                            W3 JMail 邮件组件是Dimac公司开发的用来完成邮件的发送、接收、加密和集群传输等工作的。w3 Jmail组件是国

Global site tag (gtag.js) - Google Analytics