www.9778.com 9

“兰博”附体 Intel祭出Rambo Cache技术

在众多HPC技术中,一个名叫Rambo
Cache(兰博缓存)的技术吸引了大家的注意,这个名字是Intel高级副总、独显GPU的主导者Raja
Koduri取的,相比Intel之前发布的技术命名,这个名字一点也不严肃,显示出了Raja
Koduri的小幽默——兰博可以说是美国硬汉开挂电影的代表。

“兰博”附体 Intel祭出Rambo Cache技术。在SC 19超算大会上,Intel正式宣布了他们为高性能计算打造的Xe架构GPU——Ponte
Vecchio,同时它也会首发Intel的7nm工艺,2021年会用于Intel花了50亿美元给美国国防部建造的Aurora极光超算上。

Intel正式公布了正在研发中的通用型GPU Ponte Vecchio,7nm工艺制造,Foveros
3D、EMIB封装,Xe全新架构,支持HBM显存、CXL高速互连等技术,面向HPC高性能计算、AI人工智能等领域。

www.9778.com 1

Xe
GPU架构是一个非常灵活、扩展性极强的统一架构,并针对性地划分成多个微架构,从而可用于几乎所有计算、图形领域,包括百亿亿次高性能计算、深度学习与训练、云服务、多媒体编辑、工作站、游戏、轻薄笔记本、便携设备等等。

事实上,Intel Xe
GPU架构是一个非常灵活、扩展性极强的统一架构,并针对性地划分成多个微架构,从而可用于几乎所有计算、图形领域,包括百亿亿次高性能计算、深度学习与训练、云服务、多媒体编辑、工作站、游戏、轻薄笔记本、便携设备等等。

Rambo
Cache(兰博缓存)本质上是一种用于连接CPU、GPU及HBM缓存的中介层,基于Intel的EMIB封装技术,能够提供极致的显存带宽和FP64浮点性能,且支持显存/缓存ECC纠错、至强级RAS

具体到HPC用的Xe架构上,它的EU单元可以大幅扩充到1000个,而且每个单元都是全新设计的,FP64双精度浮点计算能力是现在的40倍。

Intel还将Xe GPU划分成了三个档次:

根据Anandtech网站主编的解释,Intel选择Rambo
Cache(兰博缓存)这个名字只是暂时的,没什么具体含义,也不是什么缩写,最终的市场命名可能会跟Rambo
Cache(兰博缓存)完全不同。

Xe
HPC架构中,EU单元对外通过XEMF总线连接HBM高带宽显存,同时集成大容量的一致性缓存“Rambo”,CPU和GPU均可访问,并借此将多个GPU连接在一起,提供极致的显存带宽和FP64浮点性能,且支持显存/缓存ECC纠错、至强级RAS。

1、Xe LP:用于集成核显、入门级独显,典型功耗5-20W,最高可扩展到50W。

从网络的表现来看,大家认为Raja Koduri选择Rambo
Cache(兰博缓存)这个名字,就是炫一下,意图打击对手,告诉友商Intel还是很强大的

封装方面,EMIB用于连接GPU与HBM,Foveros则用于互连Rambo缓存,由多个GPU在同一中介层上共享。二者都会大大提升带宽效率和密度。

2、Xe HP:用于主流和发烧消费市场、数据中心和AI领域,典型功耗75-250W。

(文/快科技)    

www.9778.com 2

3、Xe HPC:用于超级计算机等,功耗暂无具体数值但基本不会有什么限制。

在发布会现场,Intel的PPT中没能清楚地展示出Ponte Vecchio
GPU的内部构造,今天Intel首席架构师、主管高性能GPU项目的副总裁Raja
Koduri放出了Ponte
Vecchio芯片的内部结构图,可以看到左右两侧各有8组Xe计算核心,目前只知道是7nm工艺制造的,里面的具体信息还缺公布。

Intel首席架构师Raja Koduri透露,Xe
GPU最初只设计了LP、HP两个微架构,后来发现HPC领域也有很大的机遇,就增加了一个,也是这次介绍的重点,可以打造百亿亿次超算平台,比如美国能源部旗下的“极光”就用了它和未来的10nm可扩展至强。

在Xe计算核心之外,四周还有Rambo
Cache缓存及HBM显存,辅以Intel为百亿亿次计算开发的CXL总线、XEMF总线,还有EMIB、Foveros封装等技术,Ponte
Vecchio GPU的技术含量实在是高。

www.9778.com 3

www.9778.com 4

Raja还声称,Xe
HPC可以扩展到多达1000个EU执行单元,而且每个单元都是全新设计的,FP64双精度浮点计算能力是现在的40倍。

Xe
HPC架构中,EU单元对外通过XEMF总线连接HBM高带宽显存,同时集成大容量的一致性缓存“Rambo”,CPU和GPU均可访问,并借此将多个GPU连接在一起,提供极致的显存带宽和FP64浮点性能,且支持显存/缓存ECC纠错、至强级RAS。

www.9778.com,封装方面,EMIB用于连接GPU与HBM,Foveros则用于互连Rambo缓存,由多个GPU在同一中介层上共享。二者都会大大提升带宽效率和密度。

www.9778.com 5

www.9778.com 6

Xe HPC将采用Intel
7nm工艺制造,官方称新工艺会加入EUV极紫外光刻技术,相比于10nm晶体管密度翻番,同时设计规则复杂度只有四分之一,而且规划了跨节点工艺优化,也就是会有更好的7nm+、7nm++。

当然,Intel早就说了第一款Xe显卡会是10nm工艺,只是这次没有给出更具体的消息,估计会在明年先推出10nm工艺、面向主流和发烧游戏市场的产品,后年再拿出7nm工艺、面向数据中心和高性能计算的版本。

www.9778.com 7

www.9778.com 8

www.9778.com 9