于3月27日的2025中国IC首脑峰会上,英韧科技株式会社开创人、董事长吴子宁缭绕“AI时代下的数据存储立异与挑战”的主题,分享了英韧科技“怎样经由过程低功耗模式及智能化调理芯片模块,帮忙数据中央实现体系功耗的动态优化”。
进入到2025年,DeepSeek-R1AI年夜模子的爆火,鞭策“存力接棒算力”趋向加快。现如今,支撑AI“存力”的基础举措措施的存储正面对新的挑战及机缘,需要更高的机能、更低的延迟和更高效的能耗治理,以满意AI数据中央对于快速数据拜候及处置惩罚的需求。ClResmc
与此同时,能耗问题同样成为数据中央的一年夜痛点。按照国际能源署的猜测,到2026年,数据中央的能耗可能跨越1,000TWh(太瓦时),这约莫相称在日本整年的电力耗损量,而该数字2022年仅为460TWh。于此配景下,怎样让数据搬移、数据分享更顺畅,从而进一步助力数据中央降低能耗,正成为存储企业聚焦的重点。ClResmc
ClResmc
英韧科技株式会社开创人、董事长吴子宁ClResmc
于3月27日的2025中国IC首脑峰会上,英韧科技株式会社开创人、董事长吴子宁缭绕“AI时代下的数据存储立异与挑战”的主题,分享了英韧科技“怎样经由过程低功耗模式及智能化调理芯片模块,帮忙数据中央实现体系功耗的动态优化”。ClResmc
存储是数字经济时代的基石
ClResmc
回首20世纪30-40年月的IT时代,IT信息财产约莫每一10-15年就会履历一次庞大的奔腾性变化。于1990-2000年的PC时代,英特尔是其时的引领者。随后,手机时代代替了PC时代,高通成为新的引领者。于已往的10年里,英伟达依附其卓着的GPU技能,成为技能及市场的引领者。ClResmc
跟着数据处置惩罚技能及CPU/GPU技能的成长,数据量也出现出指数型增加。从2010年到2028年,全世界数据量从1.2ZB增加到384ZB,年化增加率高达40%,即每一两年翻一番。这一数据增加趋向为存储市场带来了巨年夜的机缘。ClResmc
现如今,数据成了数字经济的基础,GPU、CPU等则是将数据转化为经济价值及财产价值的要害东西。于AI数据中央的成长中,虽然英伟达、GPU一直以来都备受存眷,但信息体系现实上由计较、存储及收集三年夜支柱财产支撑。ClResmc
计较方面,CPU及GPU卖力处置惩罚数据,使各类软件可以或许运行;存储方面,由于数据每一两年翻一番,不管是于数据处置惩罚历程中,还有是于最初收罗的数据阶段,孕育发生的数据都需要有被存储,是以存储财产也于不停演进,以撑持数据处置惩罚及传输的需求;收集方面,则是将数据从收罗地或者存储地传输到计较单位,从而实现数据的价值。ClResmc
于吴子宁看来,于信息财产的三年夜支柱(计较、存储及收集)中,各环节的成长必需协同共进,不克不及有短板。但当前CPU每一秒可处置惩罚60GB以上数据,GPU处置惩罚能力更是到达每一秒数TB,而收集及存储的处置惩罚能力仍逗留于十数GB级别,这使患上存储成为限定体系机能的瓶颈。ClResmc
以数据中央为例,机柜内部,每一个办事器凡是配备20多块存储硬盘,这些硬盘恰是英韧科技存眷的重点。吴子宁先容说,于初期,数据中央重要利用机械硬盘(HDD),HDD经由过程马达动弹及磁头读取数据,但机械部件的存于致使靠得住性较低、功耗较高且速率较慢。ClResmc
自2010年起,固态硬盘(SSD)逐渐崭露头角,最先代替HDD于数据中央的职位地方。机械硬盘的利用量逐年削减,SSD的利用量则逐年增长。典型的SSD重要由闪存颗粒、主控芯片及内存DRAM构成,与HDD比拟,SSD不仅去除了了机械部件,提高了靠得住性及速率,还有降低了功耗,这些特性差遣SSD成为数据中央存储装备的更优选择。ClResmc
与小我私家SSD比拟,企业级SSD于繁杂性上有了显著晋升。这不仅表现于更多的闪存颗粒上,还有表现于对于每一个存储单位存储更多比特的需求上。于已往十几年里,数据中央的存储技能履历了显著的蜕变。从初期每一个单位存储一个比特的SLC(单层单位)技能,成长到如今每一个单位可以或许存储16个比特的QLC(四层单位)技能。这类技能前进使患上存储密度年夜幅晋升,但同时也带来了新的挑战。跟着存储密度的增长,每一个比特所占的空间被压缩,数据堕落的几率也随之上升,这对于企业级SSD的运用提出了更高的要求。ClResmc
由于企业级SSD不仅要具有遐龄命及高机能,还有必需确保数据存储的绝对于靠得住性,以是它不克不及呈现任何过错。然而,跟着存储介质被不停压缩,要于晋升存储密度的同时连结甚至提高速率及靠得住性,变患上愈发坚苦。存储容量的增年夜不仅象征着更多的闪存颗粒,还有象征着更高的堕落几率,这需要主控芯片及固件代码来解决。为了应答这些挑战,主控芯片及固件代码需要具有超前纠错能力、矫捷的数据处置惩罚能力,而且需要与闪存颗粒厂商合作无懈,以确保每一一代产物都能提供更精彩的纠错能力及机能体现。ClResmc
ClResmc
于数据中央办事器利用的企业级SSD中,英韧科技的主控芯片(上图左侧的主控芯片)起到了至关主要的作用。“经由过程主控芯片及其上运行的固件代码,咱们一方面与主机CPU/GPU直接通讯,经由过程PCIe接口节制闪存单位及内存DRAM。”吴子宁先容道。ClResmc
ClResmc
企业级SSD具备较高的繁杂性,这重要源在其年夜容量需求,需要配备更多的闪存颗粒。同时,为了满意数据中央对于数据一致性及靠得住性的严酷要求,还有增长了“失电掩护”功效的电容及电路。不管是繁杂的闪存颗粒治理,还有是失电掩护机制的运行,这些均由存储主控芯片节制。总之,主控芯片不仅决议了SSD的机能不变性,还有影响着其利用寿命及靠得住性,确保于7×24小时不间断的运用场景中,数据可以或许随时被挪用。ClResmc
英韧科技作为一家自研主控芯片的公司,要于市场上不停迭代,紧跟GPU/CPU的成长,面对着诸多挑战。吴子宁夸大说:“咱们需要把握其实不断迭代焦点算法,提早结构新技能,同时确保每一次研发及流片都能一次乐成。这不仅需要持久耐烦的投资,还有需要坚定的履行力。”ClResmc
AI运用成为SSD的市场及技能的驱动力已往几年,除了了传统的数据中央及云计较,AI的落地也鞭策了数据中央的进一步成长。AI行业的成长不仅鞭策了数据中央的设置装备摆设,还有对于数据中央的软硬件运用提出了新的要求。估计到2028年,中国AI年夜范围市场的运用范围将到达1,700亿元,此中不仅包括软件运用,还有有对于硬件提出的很多新需求。ClResmc
ClResmc
AI运用及年夜模子的落地需要计较、存储及收集的同步演进。以英伟达为例,其产物线路图显示,英伟达每一年城市推出新产物,推理及计较能力每一年翻番。与此同时,DRAM等内存技能也于指数级增加,以跟上英伟达的速率。于存储方面,SSD接口速率及闪存技能也于不停演进。本年第五代PCIe最先范围商用,来岁可能会推出第六代PCIe。ClResmc
同时,AI对于存储也提出了新的要求,特别是于容量方面。传统云计较对于单盘SSD的容量需求凡是为4TB或者8TB,一般利用TLC闪存颗粒。然而,AI运用对于数据中央的存储需求更高,凡是需要64TB的SSD。ClResmc
ClResmc
为何AI数据中央需要这么年夜容量的存储呢?上面这张机柜结构图给出了谜底。图中一排有10个机柜,摆布各4个放置英伟达GPU办事器,中间2个别离用在收集互换及存储。于有限的机柜空间内存放更大都据,是当前面对的一年夜挑战。数据集中存储不仅勤俭空间,还有能削减机柜数目,进而降低电力耗损及收集接口需求,是以年夜容量存储的需求急剧增长。ClResmc
今朝,一个机柜的存储容量已经达十几个PB,不久之后有望实现100PB。此外,AI处置惩罚对于存储吞吐量要求极高,不管是天生图片、视频还有是对于话应对,都需要及时相应。与传统云计较差别,AI运用触及年夜量随机读取,如挪用模子数据及用户数据库。而写入操作重要是Checkpoint(查抄点),即于练习或者天生历程中生存中间成果,避免不测变乱或者失电。Checkpoint写入量不年夜,但要求挨次写入且机能不变,防止因写入掉败致使数据壅闭。ClResmc
英韧科技立异方案:让数据搬移及分享更顺畅针对于这些新的存储需求,英韧科技也做了周全的技能研究,提出了新的解决方案。按照吴子宁的先容,起首,公司使用这几年业界提出的一些新的接口及观点,使数据搬移及与CPU/GPU的数据分享越发顺畅。ClResmc
ClResmc
他先容了两种重要的优化数据交互流程的方案:一种是英伟达提出的GPU-Direct数据交互方式;另外一种是CXL(ComputeExpressLink)技能。ClResmc
GPU-Direct优化了传统的数据交互流程。以往,GPU从存储单位获取数据时,需经由过程CPU及PCIe互换卡,经屡次数据搬移,致使功耗高、延时长。GPU-Direct让GPU直接从存储单位获取数据,削减中间环节,降低功耗及延时,晋升数据传输效率。CXL是近几年新兴的技能,它将CPU的内存总线与外部的IO总线有机联合,同一了二者。经由过程CXL技能,CPU可以或许直接从内部挪用外部较远条理的资源,将其纳入自身的资源池。一般来讲,CXL装备有三种形态:第一种是经由过程CXL,CPU可以与网卡等加快器同享缓冲区;第二种是经由过程CXL和谈,CPU及GPU可以或许同享内存池;第三种是经由过程CXL扩大内存,可以使办事器容量扩大至现有容量的10倍以上(这也是英韧科技今朝于聚焦的方案)。ClResmc
CXL扩大内存指的是于存储范畴,可以使用“内存扩大”的机能上风,将存储单位挂接到CXL总线,使CPU可以或许更便捷地调取数据。别的,还有可以把数据直接调到运用单位、直接调到GPU节省能耗、勤俭链路的延时。除了此以外,英韧科技也于使用新的存储介质做立异产物。ClResmc
ClResmc
传统存储介质受物理限定,于成本及效能间存于衡量。HBM及DDR的容量有限,而Flash虽自制且容量年夜,但速率较慢。今朝,业界正于研究介在二者之间的新型存储介质,如接近DRAM的RAM、PCM、MRAM,以和接近Flash的LowLatencyFlash,后者使用成熟的Flash工艺,可以把机能晋升至本来的10倍。ClResmc
联合超低延时Flash及CXL接口,可创造出立异产物。如经由过程CXL毗连DRAM扩大存储,形成同享资源池,提高差别CPU/GPU间数据调理效率;或者于CXL主控后毗连低延时Flash,年夜幅扩大内存可拜候空间。ClResmc
ClResmc
新型存储介质为降服AI带来的挑战提供了新思绪。于功耗优化方面,英韧科技使用低功耗模式及智能调理芯片模块,自动举行流量节制及监控,实现体系功耗的动态调解,使功耗按照运用需求到达最优。ClResmc
据相识,经由过程智能功耗调解技能,英韧科技的主控芯片功耗降低了近30%,整盘功耗降低了10%。于AI数据中央耗电量巨年夜的配景下,如许的功耗优化显患上尤为主要。ClResmc
小结:瞻望将来,AI运用场景正驱动存储及IT行业重塑成长。英韧科技依附多年技能堆集,聚焦高密度、高速率、低延迟及低功耗等要害技能,充实使用新型存储介质及接口,经由过程立异的主控架谈判智能化数据分层,使内存、闪存和新型非易掉性介质协同事情,为体系设计职员提供便当。ClResmc
末了,吴子宁夸大说:“咱们将连续立异,不停演进主控芯片,为AI及云计较提供安全靠得住的存储解决方案。”ClResmc
-leyu乐鱼电子