我可以: 邀请好友来看>>
ZOL星空(中国) > 硬件星空(中国) > 显卡星空(中国) > 小影霸显卡星空(中国) > 小影霸GX60-10盘古版星空(中国) > 【小影霸 GX60盘古版试用】CUDA并非“鸡肋”,GX60解放CPU让游戏...
帖子很冷清,卤煮很失落!求安慰
返回列表
签到
手机签到经验翻倍!
快来扫一扫!

【小影霸 GX60盘古版试用】CUDA并非“鸡肋”,GX60解放CPU让游戏性能更给力(上)

875浏览 / 2回复

命如玄霄

命如玄霄

72
精华
2082
帖子

等  级:Lv.9
经  验:54514
  • 天下无双
  • 点睛之笔
  • 点石成金
  • 星空(中国)精英
  • 星空(中国)骨干
  • 滴水穿石
发表于 2011-01-14 09:30:11
电梯直达 确定
楼主

【小影霸 GX60盘古版试用】CUDA并非“鸡肋”,GX60解放CPU让游戏性能更给力(上)

小影霸朴实的外表下却拥有着这么多强大的技术支持:DX11、3D vision、PHYSX、CUDA、SLI等等,今天就来给大家说说CUDA的作用吧,这可是N卡特有的哦。

 

 

【小影霸 GX60盘古版试用】CUDA并非“鸡肋”,GX60解放CPU让游戏性能更给力(上)

【小影霸 GX60盘古版试用】CUDA并非“鸡肋”,GX60解放CPU让游戏性能更给力(上) 

【小影霸 GX60盘古版试用】CUDA并非“鸡肋”,GX60解放CPU让游戏性能更给力(上) 

CUDA的发展史

实际上,CUDA是在2006年的11月与G80这款产品一同诞生的,20072NVIDIA首次发布了CUDA的公测版,而在20076月,CUDA 1.0版与Tesla系列正式登场,到了07年底,CUDA 1.1测试版放出。在CUDA 1.1测试版当中,NVIDIA为其增加了一些新的功能。

 

    CUDA 1.1版本发布后,NVIDIA也适时的推出了适合CUDA的驱动程序。当时NVIDIA就已经表示,只要GeForce 8系列或更高版本的显卡产品搭载169.XX版本以上的驱动就可以支持CUDA功能了。这是一个非常重要的举措,因为这就意味着,在今后任意一台拥有GeForce 8以上的显卡都能够支持CUDA了,而无需必须用有一台专业的Tesla产品才能够实现CUDA加速。此外,CUDA 1.1版本还增加了异步执行与数据复制(仅限于G84G86G92或更新的产品)、异步数据传输、显存、支持64bit Windows操作系统以及多GPU SLICUDA的支持等等功能。

 

  而最新的版本则是GeForce GTX 200系列产品发布时同步推出的CUDA 2.0版本,而CUDA 2.0测试版则是在今年春天的早些时间推出的。在CUDA 2.0版本当中,增加了如下内容:支持双精度运算(仅支持GT200系列产品)、支持Windows VISTA操作系统(包括32bit64bit)、支持MacOS X操作系统、分析调试器3D纹理支持以及优化数据传输等。 

 

  CUDA发布2.0后目前支持的硬件方面分为3个级别,面向娱乐消费方面的GeForce,面向专业图形设计市场的Quadro,还有面向GPU计算的产品,它不具备图形输出的功能,面向不同的应用领域,NVIDIA方面推出不同的产品。这方面也可以看出CUDA的应用方面之广。未来NVIDIA方面还会完善CUDA,现在就NVIDIA的数据已经有8000万的支持CUDAGPU已经销售出去了,这样看来CUDA的应用就有了其存在的支持,你的GPU不单单只是作为一个图形处理芯片,只要有支CUDA的软件开发,那么对于一般的消费者来说,就是等着享受就是了。

 

  目前普通消费者能在市面上看见支持CUDAGPU产品从笔记本到高性能GPU的系统中。也就是普通的用户,我们使用的普通笔记本到台式级【小影霸 GX60盘古版试用】CUDA并非“鸡肋”,GX60解放CPU让游戏性能更给力(上) 

Adobe公司的PhotoShop仍在不断的发展,因为它要让新的版本能够有足够的吸引力、足够新的功能,骗欧美的正版用户不断地掏银子升级。当然,在我国,这样险恶的用心显然是无法达成的。

  这是一个倡导分工合作的时代,这是一个提倡专业化的时代。PhotoShop想要进步,要想从用户那里“骗”来更多的升级费用,那一定要从其他的领域吸取营养。最新的PHOTOSHOP CS4的魅力在于Adobe公司与最大的显卡芯片厂商NVIDIA合作,能够基于CUDA平台对软件进行优化和加速。

  CUDA平台是NVIDIA今年研发的一套利用GPU的能力的运算平台,通过这套平台,显卡不再仅仅是图形计算的工具,直接通过更适合并行运算的GPU对任务进行优化。NVIDIA今年推出的大多数新技术,包括PhysX物理加速都是借助此技术而开发的。现在在CUDA编程的大本营“CUDA Zone”有上百个科学运算项目被共享,CUDA正在为许多科研项目做出贡献。

  Adobe公司一直以来对CUDA技术都非常感兴趣,不仅仅是PHOTOSHOP CS4运用了这一技术,而且早先的Adobe Reader、Adobe Flash Player……都运用了这一技术提供了加速选项,在最新发布的CS4套装软件中,支持GPU加速的软件共三款,包括Photoshop CS4,Premiere CS4和After Effects CS4,当然,离我们关系最近的当然还是PHOTOSHOP,通过mop等社区,PS已经成为一种大众软件深入群众之中。

  Adobe CS4的一项关键要点在于它可以充分利用GPU强大的计算能力。与使用CPU运行CS4的差距显而易见。对于专业的创意人员来说,性能是非常重要的。凭借NVIDIA GPU,他们可以与创造出来的图像和视频互动,而且运行速度更快,画面更清晰,效果更生动。在Photoshop CS4中,GPU可提供对图像旋转、缩放和放大平移这些常规浏览功能的加速,还能够实现2D/3D合成,高质量抗锯齿,HDR高动态范围贴图,色彩转换等特效。

  当然,想要体验CUDA带给PHOTOSHOP的性能提升,想要成为了解最新技术的PS达人,一款NVIDIA的显卡就必不可少。

 

虽然G80GT200图形核心已经可以在CUDA运算方面做的非常不错,但是GF104系列核心具有更强大和更精准的CUDA运算能力,因为从架构设计的开始,NVIDIA就为其注入了CUDA运算的灵魂。

 

首先,新架构提供了对并行线程执行2.0指令集的支持,PTX是级别较低的虚拟机和ISA,目的是为了支持并行线程处理器的运作,在PTX被载入的时候,PTX指令会被GPU转换为可读的机器代码PTX 2.0增加了很多新特性,比IEEE 32位浮点精度、所有变量和指针都有统一的寻址空间、支持64位寻址、OpenCLDirectCompute的新指令,以及最重要的对C++语言的支持,这些都将将会对GPU的可编程性、精度以及性能方面带来较大的提升。

 

其次,对于各种不同的应用程序来说,虽然共享缓存能够解决不少问题,但并非能够解决所有问题。程序当中经常会出现关联共享缓存的情况,而有些程序则更希望调用高速缓存,甚至还有要求两者全部调用的情况。为了让这些程序能够得到更好的优势,且满足不同的需求GF104核心设计了全新的内存层级结构。

 

GF104当中,抛弃了原有的纹理操作提供只读而像素数据提供只写的情况,改为了全新的加载/存储单元。并且在GF104当中的每一个SM阵列当中均增加了一个L1高速缓存,同时配备所SM阵列可以共享的L2缓存,如此以来所有读取以及存储操作均可被支持。在每个SM阵列当中的64KB缓存上,可以将其分为48KB共享缓存和16KBL1缓存组合,也可分为16KB的共享缓存和48KBL1缓存组合。对于例如电子动态模拟这类需要大量使用共享缓存的程序,其性能将得到三倍左右的提升,而对于一些无法确定内存访问情况的程序,48BKL1缓存设置则将会发挥更大功效。

 

另外,GF104GigaThread引擎也经过了改进,G80GigaThread引擎能够管理最多12288个线程,在新的架构当中,GigaThread引擎得到了再次提升,并且加入了最新的双级分布式线程调度器技术GigaThread引擎负责将准备处理的线程块格为不同的SM阵列分配为线程块,而每个SM阵列当中的双Warp调度器负责将每个线程块分配为32个线程。FermiGigaThread引擎提升了线程吞吐率,同时动态加快了上下文交换、并发内核执行、以及改进的线程块调度等操作。

MY阿冰

MY阿冰


精华

帖子

等  级:Lv.8
经  验:48418
发表于 2011-01-14 09:47:53 1楼
支持!

bq0957652

bq0957652


精华

帖子

等  级:Lv.1
经  验:22
发表于 2011-03-18 14:54:02 2楼
分享! 帮顶!

dsdfffsw

dsdfffsw


精华

帖子

等  级:Lv.1
经  验:208
发表于 2012-04-14 14:12:11 3楼

您的内容正在火速审核中,请稍等

高级模式
星空(中国)精选大家都在看24小时热帖7天热帖大家都在问最新回答

针对ZOL星空(中国)您有任何使用问题和建议 您可以 联系星空(中国)管理员查看帮助  或  给我提意见

快捷回复 APP下载 返回列表