产品推荐(Intel®):Sapphire Rapids
当前位置:首页 > 技术热点 >
产品推荐(Intel®):Sapphire Rapids


英特尔于ISC 2021中介绍了Ice Lake的下一代至强可扩展处理器 -- Sapphire Rapids。Sapphire Rapids将采用 10nm Enhanced SuperFin制程工艺,微架构升级为全新的 GoldenCove并集成更多的核心,还通过英特尔高级矩阵扩展(AMX)指令集来进一步强化AI性能。SapphireRapids隶属于属于EagleStream平台(未来还将有EmeraldRapids),加入了8通道DDR5内存、PCIe5.0协议以及CXL1.1标准。SapphireRapids各型号产品于2023年第一季度陆续投入生产,代号蓝宝石急流(Sapphire Rapids),开始了急流(Rapids) 系列,而不再称作某湖(Lake),暗示了它和消费品CPU设计上从此分野。的确,作为开拓者的第四代至强可扩展处理器,在它面向的数据中心市场的各个性能和功能维度上,进行全面提高和改善。除此之外,SapphireRapids还将具有集成HBM高带宽内存的型号。

在物理层面,Sapphire Rapids最多可以拥有60个核心,LGA4677封装接口,LGA4677封装接口,八通道DDR5-4800,扩展连接提供80条PCIe 5.0/4.0通道,最多可以集成64GB HBM2e内存。

Intel Eagle Stream平台与Sapphire Rapids的到来,终于能够帮助英特尔在服务器市场竞争中解决核心数量不足的难题,并寻找商用解决方案新方向,引入x86高级矩阵扩展(AMX),CXL 1.1,DDR5,PCIe 5.0等新技术。


image.png


image.png

消费级处理器不同的是,Sapphire Rapids只有P-Core,即全员Golden Cove,并首次使用芯粒(或者称为小芯片)封装,利用嵌入式多芯互连桥技术(Embedded Multi-die Interconnect Bridge,EMIB)最大限度的减少延迟和拓宽带宽,核心数量也进一步提升,因此被英特尔称为十年来数据中心级处理器最大的提升。

源自于Alder Lake的Golden Cove与Ice Lake 的Cypress Cove相比,单线程IPC性能提升19%,主要得益于架构发生较大变化,包括:

  • 16B → 32B 长度解码

  • 4-wide → 6-wide 解码

  • 5K → 12K 分支目标

  • 2.25K → 4K μop 缓存

  • 5 → 6 宽分配

  • 10 → 12 个执行端口

  • 352 → 512 条目重排序缓冲区

image.png


除了这些关键指标之外,为了数据与算力这两大热门方向,第四代至强可扩展处理器在CPU和南桥中自带七大算力神器。

全面对数据处理和人工智能算力进行加速,让加速无所不在:

英特尔@ 高级矩阵扩展(英特尔@ AMX) : 可加深度学习(DL) 推理和训练工作负载,例如自然语言处理(NLP)、推荐系统“和图像识别:

英特尔@ 教据流加速器(英特尔@ DSA): 可通过改善流式数据移动和转换提作,为存情、网络和教据密集型工作负载提供高性能:

英特尔@ 存内分析加速器(英特尔 IAA):可提高分析性能,同时从CPU核心卸载任务以加速教据库查询香叶量和其他工作负载;

英特尔@ 动态负载均衡器(英特尔@ DLB) :可以随系统负的变化动态地将网络教据分发到多个CPU 核心,从而提供高效的硬件级负载平衡:

英特尔@ 高级矢量扩展 512 (英特尔 AVX-512) : 支持多达两个融合乘加(FMA) 单元,并包含多项优化来提高要求严苛的计算任务的性能;

英特尔@ 教据保护与压缩加速技术(英特尔@ QAT): 可加加密、解密和数据压缩,从处理器核心卸载这些任务以帮助减少系统资源消耗:

英特尔@ 密码提作硬件加速 (Intel@ Crypto Acceleration) : 可减少实施普数据加密的代价,并提高加密敏感型工作负载的性能,如安全套接层(SSL) Web 服务器、5G 基础设施和VPN/防火墙

服务器上的Golden Cove将围绕多线程表现性进行,不仅启用AVX-512,并且每个内核配备2MB二级缓存,与最新的13代酷睿中的Raptor Cove相当,支持x86高级矩阵扩展(AMX)和加速器接口架构指令集(AIA),以支持对加速器和设备的有效调度、同步。


image.png


AMX指令用于加速机器学习速度,属于DL Boost系列的AVX512_VNNI、AVX512_BF16之后的第三项指令,与前两者均建立在AVX512之上不同,AMX自带存储和操作的独立扩展,它引入了一套新的矩阵寄存器堆,包括8个1024-bit寄存器,调用方式则与AVX512相似,因此在整体结构上不需要做出修改,能够与其他x86交错使用。同时在调用矢量和矩阵指令时,每个内核都会有独立的细粒度电源控制器,以避免消费级CPU在运行AVX时候遇到频率下降的情况。

按照最初设计预想,英特尔Sapphire Rapids推出应该需要与AMD Milan或者Milan的3D V-Cache缓存堆叠版本展开竞争。但实际上Sapphire Rapids推出的节骨眼不得不面临AMD Zen 4的次时代挑战。但英特尔服务器级处理器的优势永远不是核心数量那么简单,通过特定的加速器优势,Sapphire Rapids仍然会成为未来一段时间服务器市场换新的主要考量。

从PCIe 5.0、DDR 5到内核的升级,也将带动服务端新一轮产业升级,再加上转向芯粒方式提升量产成功率,Sapphire Rapids后续表现依然让人期待。

深圳市科通技术股份有限公司    客服电话:(+86)755-26018083    邮箱:cs@comtech.cn

© Copyright 2018 www.comtech.cn | 粤ICP备19161615号 | 粤公网安备 44030502003347号