当 CUDA 遇上 Denver , Tegra 不光只是娱乐级应用处理器

Mar16

以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!

这次GTC的新架构规划表当中,NVIDIA宣布下两代Tegra的关键特性,其中将于明年正式推出的Logan(金刚狼)虽仍持续使用ARMv7指令集的CPU架构,不过GPU却准备导入与桌上型GPU同级的Kepler架构,这也意味着ARM架构的应用处理器将获得真正的运算级SoC设计。

跳转继续

而密谋多年但似乎消声觅迹一阵子的ProjectDenver也紧跟在后,预计于2015年问世,也就是再下一代的Tegra"Parker(蜘蛛人)",除了GPU将换上同一时期的全新GeForce架构Maxell外,更将CPU换上采用ARMv864位元指令集的Denver核心(但NVIDIA并未透露采自主架构或ARMCortex-A50架构),至此的Tegra更将CUDA携手ARM引领到高效能运算的层级。

而NVIDIA将最擅长的GPU大量且积极的导入Tegra产品线,意味着ARM与GPU的异构运算条件逐渐成熟,才会使NVIDIA自08年开始发展的CUDA平行运算技术导入Tegra当中。另一方面更表示高效能运算不再只是躺在研究中心内遥不可及的领域,而是足以在不知不觉当中改变人类日常生活的平民化技术。

事实上,自今年开始,手持设备的平型运算运用就已经数度被提到,在手持设备相机上的应用大大改变手机拍照的形式与机能;只要一张照片,透过CPU、GPU与DSP三者合作下,达到即时的HDR渲染,或是高速的追踪拍摄物体、精确的脸部辨识等等,甚至大大超越传统相机的机能,这都是拜手机应用处理器的GPU加速与异构运算所赐。

而NVIDIA选择下放CUDA核心架构到Tegra当中,更代表许多原本用于PC的伺服器与运算中心的CUDA平行运算,也能在这样一颗小小的应用处理器被实现;且今年ARM架构也传来捷报,被百度导入作为数据资料库的硬体架构。若于支援64位元指令集的Parker实做,透过更高的记忆体容量支援,加上ARM最擅长的多核战术,以大量的Paker处理器进军高效能运算甚至超级电脑也不再是空谈。

当然Tegra也不可能忘掉手持设备的领域,借由64位元与CUDA核心GPU,手机、平板引发的口袋内的运算革命又将更上一层楼,x86的高效能运算优势将渐渐流失。尤其别忘了现在手机、平板的效能不断提升,已经有许多原本专精于电脑的高阶工具软体也转战手持设备,若手持设备运算效能再次提升,靠手机与平板进行进阶的修片、影像渲染也不是难事。

笔者个人认为,NVIDIA今天推出Kyala也是为了未来布局,尤其当黄仁勋展示即时的光线追踪时,相信不少在现场的软体与伺服器开发者已经意识到Kyala就是一个让他们提前为Tegra平行运算做准备的开发平台。不仅可供伺服器开发商验证ARM搭配CUDA的低功耗、高效能运算的可行性,在Kyala实做的软体,未来可以直接透过向下相容的方式套用在新的Tegra平台上,为未来预先做准备。