NVIDIA DPU综合介绍,华为计划2030年左右推出6G;台媒称台积电已断供

2024-12-31 足球 阅读 3

NVIDIA DPU综合介绍

数据中心技术设施单芯片。

NVIDIA在GTC 2020秋发布了Bluefield DPU,并在GTC 2021进一步推出Bluefield3。NVIDIA的影响力在行业内引起巨大反响。现代数据中心的工作负载多元化,AI和数据分析应用在多个GPU和计算节点上分布式运行,云端服务由微服务组成并分散在不同节点。这导致东西向流量大幅增加,给网络带来巨大压力。为此,NVIDIA开发了Magnum I/O SDK,通过Mellanox RDMA技术卸载数据搬运任务,加速Mellanox网卡上的网络、存储和安全处理,并为每个计算域提供加速器。

NVIDIA DPU综合介绍,华为计划2030年左右推出6G;台媒称台积电已断供

随着数据中心转变为软件定义,计算虚拟化使得资源池化更简单,管理扩展到了网络、存储和安全。为了应对对灵活性的极致要求,硬件功能被转化为CPU上的软件服务,整个数据中心成为软件可编程的“软件即服务”。虚拟机通过虚拟交换机和路由器发送数据包,防火墙虚拟化,保护每个节点,微切分确保东西向通信安全。软件定义数据中心是最佳选择,但软件执行所有“数据中心基础架构”处理给CPU带来负担。

随着大规模数据中心工作负载增加,虚拟化、网络、存储和安全处理持续增长,消耗大量CPU资源。因此,设计新型处理器,专门用于数据传输和安全处理的DPU应运而生。DPU由加速器、ARM CPU组成,用于网络、存储和安全,减轻虚拟化Hypervisor的工作负载。Bluefield2 DPU是一个包含加速器引擎的可编程处理器,用于在线处理网络、存储和安全。它是一个数据中心基础架构单芯片,具有ARM CPU、高性能加速器和硬件引擎,可安全处理私有云、公有云和混合云。

Bluefield2 DPU通过隔离应用程序域和技术设施域、存储加密秘钥、支持SHA256认证和加密协议处理等功能,提供正则表达式、深度包检测加速、Web应用防火墙、带外恶意软件检测等功能。它还具备流量速率控制、支持NVMe存储处理器、计算和存储服务器的理想选择、支持弹性块存储服务、支持存储加密、去重和压缩等功能。此外,Bluefield2 DPU在高性能网络处理方面表现优秀,具有工业界最佳的RDMA和加速交换、支持OpenStack和Kubernetes的软件定义网络加速。

Bluefield2 DPU具有接近70亿晶体管,是一个可编程的单芯片数据中心技术设施处理器。NVIDIA发布了DOCA编程框架,允许开发者为软件定义的网络、存储、安全和遥测以及基于网络的计算应用开发应用程序。DOCA构建在开源API之上,如用于包处理的P4、用于网络的DPDK、用于存储的SPDK,以及CUDA和NVIDIA AI。DOCA完全兼容无缝集成到主流OS和Hypervisor中。基于DOCA编写的应用程序可以在Bluefield2 DPU上运行,并在后续DPU版本中继续运行。

与VMWare合作,将虚拟化、网络、存储及安全功能转移到Bluefield中,构建分布式、零信任的安全架构。全球70%的企业使用VMware平台,推动软件定义数据中心革命。合作将Bluefield作为基础架构处理器,VMware作为数据中心基础架构OS平台,重新定义数据中心。将虚拟化、网络、存储及安全功能转移到Bluefield上,建立分布式、零信任的安全架构,大幅提升全球3-4千万企业服务器的效率和安全性。

Bluefield2只是一个起点,DPU的发展正在加速。Bluefield3已经进入设计阶段,Bluefield4正在开发规划中,将加入CUDA和NVIDIA AI技术。每一代Bluefield都能与DOCA兼容,提供从200-400Gbps的数据处理带宽。随着技术的引入,运算性能将在几年内提升1000倍。

云计算和AI推动数据中心架构的根本性变化。过去,企业数据中心运行单一软件包,虚拟化开创了向软件定义数据中心迈进的趋势。应用可以迁移,并通过“单一管理平台”进行管理。虚拟化技术使得计算、网络、存储以及安全等功能可以通过软件仿真运行在CPU上,尽管更易于管理,但随之而来的CPU负荷降低数据中心运行应用的能力。云计算再次重构数据中心,为数亿消费者提供服务,大型应用分解为微服务,利用任何空闲资源,多个工程团队可以同时工作。微服务产生“东西向”流量,让数据中心网络变得拥挤。通过Mellanox的高速低延迟网络,解决了这一问题。随着深度学习的发展,GPU应用激增,消费级AI服务成为GPU超算技术的主要客户。基础设施软件数量上升,特别是“零信任”安全兴起,成为数据中心内最大的工作负载。

NVIDIA DPU综合介绍,华为计划2030年左右推出6G;台媒称台积电已断供

结论是使用新型处理器专门处理数据中心基础架构,比如NVIDIA的Bluefield DPU。以云游戏服务GeForce Now为例,NVIDIA的云端GeForce服务为70多个国家和100万会员提供服务。GeForce Now使用NVIDIA vGPU技术,虚拟网络、存储和安全完全由软件完成,CPU负载高。通过Bluefield,基础设施从游戏负载中分离,卸载并加速网络、存储和安全。GeForce Now基础设施成本高,借助Bluefield,服务质量得以改进,同时增加并发用户量,投资回报率良好。

DOCA是我们为Bluefield编程的SDK,简化了应用程序向Bluefield加速器和可编程引擎的卸载流程。每一代Bluefield都将支持DOCA,因此,下一次Bluefield到来时,今天的应用程序和基础设施将变得更快。NVIDIA首个数据中心基础设施SDK,DOCA 1.0现已发布,包括DPI、安全启动、TLS加密卸载、RegEx加速以及硬件实时时钟,用于数据中心5G和视频广播同步。与优秀合作伙伴合作,实现对各种领先平台的优化,包括基础设施软件供应商、边缘和CDN供应商、网络安全解决方案和存储供应商。涵盖了全球最杰出的数据中心基础设施公司,将使用Bluefield加速所有这些应用。

虽然刚开始使用Bluefield2,但我们今天发布的Bluefield3是首款400Gbps网络芯片,具有16个ARM Core,可运行整个虚拟化软件栈,例如VMware ESX。Bluefield3使安全保障再上一个台阶,全面卸载并加速IPSEC和TLS加密算法、秘钥管理以及正则表达式。Bluefield2卸载相当于30个CPU核的负载,通常需要300个核才能达到卸载和加速网络流量到400Gbps,性能提升10倍。我们以每18个月的节奏推出新一代Bluefield。Bluefield3提供400Gbps处理带宽,性能是Bluefield2的10倍。Bluefield4将实现800Gbps处理带宽,并加入NVIDIA AI计算技术,计算能力提升10倍。3年内性能提升100倍,满足市场的需求。市场上每年交付的大约3000万台数据中心服务器中,有1/3用于运行软件定义数据中心堆栈。这种工作负载增长速度远超摩尔定律,因为我们一直在产生和传输大量数据。除非卸载或加速这些负载,否则数据中心用于应用的CPU将越来越少。

四大芯片巨头决战数据中心

在大数据的驱动下AI技术有了实现商用的可能性,同时,随着智能化场景的不断扩大,用作于数据处理和存储的数据中心建设也在全球范围内兴起。根据Arizton的报告显示,从投资额进行计算,预计全球超大规模数据中心市场规模将在2026年达到1276.4亿美元,在2020至2026年内该市场将以超过4.02%复合年增长率保持增长。

显然,通过收购的方式,是加快数据中心芯片布局的方式之一,而在这背后,也预示着,这四大芯片巨头决战数据中心的步伐也加快了。

根据IDC的预测显示,2015年到2025年,数据将以每年25%的速度增长。这些数据的增长带动了云端计算和边缘计算等市场的兴起,他们的增长也拉动了数据中心市场的成长。由此,芯片巨头们也在数据中心市场展开了布局。

英特尔是全球最大PC和数据中心服务器CPU制造商,2017年初他们更是将其以“PC为中心”的战略转移到“以数据为中心”的业务中,从2017年初他们确立了这个战略后,到了2019年,数据中心业务便表现出了较好的成绩。到2020年,其全年财报体现出以数据为中心的转型取得了显著进展,数据中心业务呈迅猛发展态势——2020年相较2019年增长11%。

也因此,英特尔已经将以数据为中心业务的总体潜在市场规模由2021年的1600亿美元调整为2022

NVIDIA DPU综合介绍

数据中心技术设施单芯片。

NVIDIA在GTC 2020秋发布了Bluefield DPU,并在GTC 2021进一步推出Bluefield3。NVIDIA的影响力在行业内引起巨大反响。现代数据中心的工作负载多元化,AI和数据分析应用在多个GPU和计算节点上分布式运行,云端服务由微服务组成并分散在不同节点。这导致东西向流量大幅增加,给网络带来巨大压力。为了应对这一挑战,NVIDIA开发了Magnum I/O SDK,通过Mellanox RDMA技术卸载数据搬运任务,加速Mellanox网卡上的网络、存储和安全处理,并为每个计算域提供加速器。

随着数据中心转变为软件定义,计算虚拟化让资源池化变得更简单,管理扩展到了网络、存储和安全。为满足极致的灵活性要求,硬件功能被转化为CPU上的软件服务,整个数据中心成为了可编程的“软件即服务”。虚拟机通过虚拟交换机和路由器发送数据包,虚拟防火墙保护每一个节点,微切分确保东西向通信安全。虽然软件定义数据中心是最佳选择,但软件执行“数据中心基础架构”处理给CPU带来了额外负担。

随着大规模数据中心工作负载不断增加,虚拟化、网络、存储及安全处理消耗了大量CPU资源。因此,新型处理器DPU应运而生,专门用于数据传输和安全处理。DPU由加速器和ARM CPU组成,减轻虚拟化Hypervisor的负担。Bluefield2 DPU包含加速器引擎,在线处理网络、存储和安全,作为一个数据中心基础设施单芯片,Bluefield2 DPU具有ARM CPU、高性能加速器和硬件引擎,能够安全处理私有云、公有云和混合云。

Bluefield2 DPU提供多种功能,如隔离应用程序域和技术设施域、存储加密秘钥、SHA256认证及加密协议处理。它支持正则表达式、深度包检测、Web应用防火墙、带外恶意软件检测、流量速率控制、NVMe存储处理等,为计算和存储服务器提供理想解决方案。此外,Bluefield2 DPU在高性能网络处理方面表现良好,具有行业最佳的RDMA和加速交换能力,并支持OpenStack和Kubernetes的软件定义网络加速。

拥有近70亿晶体管的Bluefield2 DPU是一个可编程的单芯片数据中心技术设施处理器。NVIDIA发布的DOCA编程框架允许开发者为软件定义的网络、存储、安全等应用开发程序,DOCA完全兼容主流OS和Hypervisor。基于DOCA编写的应用程序能够在Bluefield2 DPU上运行,并在未来DPU版本中继续使用。

与VMWare的合作使得虚拟化、网络、存储及安全功能转移到Bluefield上,构建一个分布式、零信任的安全架构。全球70%的企业使用VMware平台,推动着软件定义数据中心的革命。Bluefield作为基础架构处理器与VMware合作,重新定义数据中心,有效提升全球数千万企业服务器的效率和安全性。

Bluefield2仅是起点,DPU的发展正在加速。Bluefield3已进入设计阶段,Bluefield4正在开发中,将引入CUDA和NVIDIA AI技术。每一代Bluefield都能与DOCA兼容,提供从200-400Gbps的数据处理带宽,预计未来几年运算性能将提升1000倍。

云计算和AI推动数据中心架构的根本性变化。企业数据中心过去运行单一软件包,虚拟化使其向软件定义数据中心发展。微服务生成的东西向流量使数据中心网络变得拥挤,而Mellanox的高速低延迟网络则缓解了这个问题。深度学习的突破使GPU应用激增,消费级AI服务成为GPU超算技术的重要客户,由此基础设施软件数量上升,尤其是“零信任”安全需求已成为数据中心的主要工作负载。

总结而言,使用新型DPU如NVIDIA的Bluefield能够有效处理数据中心基础架构。例如,NVIDIA的云游戏服务GeForce Now为全球70多个国家的100万会员服务,通过Bluefield将网络、存储和安全负载卸载,提升基础设施性能。DOCA则简化了应用程序向Bluefield加速器的卸载流程,确保未来的Bluefield与现有应用兼容。

四大芯片巨头决战数据中心

在大数据驱动下,AI技术实现商用的可能性逐渐增加,全球的数据中心建设也在快速兴起。预计到2026年,全球超大规模数据中心市场规模将达到1276.4亿美元,并将保持超过4.02%的复合年增长率。

收购是加速数据中心芯片布局的方式之一,四大芯片巨头因此加快了在数据中心的布局。

根据IDC的预测,数据在2015至2025年期间将以每年25%增长,推动云计算和边缘计算市场的兴起,从而促进数据中心市场的成长。芯片巨头们也在积极布局数据中心市场。

英特尔是全球最大的PC和数据中心服务器CPU制造商,将“PC为中心”的战略转移到“以数据为中心”的业务中,数据中心业务近年来增长显著,2020年增长达到11%。

AMD凭借EPYC系列产品也在数据中心市场崭露头角,2021年第一季度AMD的X86处理器在数据中心的销售份额达到11.5%。数据中心市场的扩张显著提升了AMD的营收。

NVIDIA DPU综合介绍,华为计划2030年左右推出6G;台媒称台积电已断供

与其他三大芯片巨头不同,英伟达以GPU优势进入数据中心市场,其数据中心业务在2021财年收入首次超过10亿美元,展示出强劲的增长势头。

英特尔提出XPU异构愿景,计划在CPU基础上加入GPU、FPGA及AI芯片,推动数据中心市场的发展。为了实现该愿景,英特尔在收购方面频繁出手。

在数据中心市场布局上,AMD收购了FPGA领域龙头赛灵思,而英伟达则通过收购Mellanox获得网络技术,并计划收购Arm,进一步增强产品竞争力。

Marvell也在数据中心市场崭露头角,推出了基于5nm技术的DPU产品,扩大了市场竞争格局。

这些巨头的竞争推动了数据中心的发展,未来这些市场的主导权将取决于技术创新与收购战略。

Marvell OCTEON 10:全球首发5nm DPU,集成ARMv9 Neoverse N2,集成AI引擎

Marvell的OCTEON 10 DPU面向云计算、5G通信和数据中心应用。该芯片采用5nm ARM Neoverse N2平台,支持1Tb交换机并具备可编程功能,数据路径和安全工作负载性能达到超过400G,配备机器学习硬件加速引擎。

OCTEON 10优于Bluefield-2 DPU,支持高速I/O接口和虚拟功能,广泛适用于云和数据中心应用。

NVIDIA MGX带来了什么?

NVIDIA MGX引领变革,旨在提升服务器架构。MGX以模块化为目标,缩短开发时间,加强灵活性,通过融合多类NVIDIA硬件,提升投资回报率。

MGX展现出灵活性,兼容多代NVIDIA硬件,旨在推动服务器进入更高效、更可持续的新时代。

华为计划2030年左右推出6G;台媒称台积电已断供

华为将在不久发布6G白皮书,明确6G网络的前景。同时,台媒报道称台积电已因美国出口管制政策停止为部分大陆公司供货。今年华为与国际企业再次明确将与国内车企联合打造汽车子品牌,宣布不单独造车,致力于赋能车企。

NVIDIA创始人黄仁勋宣布推出基于Arm架构的处理器,涉及计算机细分市场、数据中心技术及自动驾驶领域。美国政府则积极应对全球芯片短缺问题,支持半导体行业的发展。

文章评论

相关推荐