其实,通俗的来说,超算的算力是fp64算力,而且一般超算所谓的算力,是指超算集群在解一个超大规模线性方程时候所达到的fp64算力,也就是linpack°算力:这个算力需要用lu分解方法迭代求解一个足够耗尽超算全部算力的大尺度线性方程,而且要求求解的精度要达到1e-12或者更低(具体是多少记不太清了
而ai所需要的精度,仅仅是fp4/fp8/fp16/tf32,根本达到不了超大规模的线性方程,精度不达标。
其实按照linpack的收敛要求,fp32,甚至各种strasseno变种的fp64gemm也不能达到精度要求。
按照超算依据linpack换算算力的算法,dgx°的那堆fp4之类的ai算力在linpack等效算力=,对主要是面向解微分方程组~的数值计算来说,al那些算力价值为。
在8年代的risc风潮,首先是mips出场。
可惜后来的mips后来授权太多,后面互不兼容做崩了,现在只有龙芯还在做,外国人反过来只能以龙芯cpu作为平台。
sun的sparc,做到27一度做不下去开源了(开源ultrasparct1/t2时期飞腾据此做过ft-1/ft-15,被甲骨文收购以后又坚持了十年,近期甲骨文已经放弃ultrasparct5转向amdzen/zen2架构。
还剩本子还在用sparc64架构而且最近在努力转arm,而hp的pa-risc,坚持到25年,放弃换intel安腾,结果安腾巨坑,分家后hp做至强,hpe转向amdzen/zen2架构。
motorola第一代risc是mc88,随后与ibm联合研制的poerpc系,28年退出,放弃cpu。ibm最终把poerpc开源社区化。ibm做的蓝色基因系超算,还在坚持用poerpc的cpu。
名义上的decalpha是最强的,结果死的最早,98年就崩盘,先被康柏买下,再被惠晋买下。无疾而终。然而临死前开源,最终在我国由申威魔改异构众核架构,发展成神威超算系列。
主流cisc也就intel和amd,他们在世纪初就在微架构里半risc化了。而同时risc也学起cisc把指令集越加越多。现在是22年了,可以说标志着risc、cisc的cpu架构们,几乎没有实质上的明确差别了。
目前主流的商用超算,数量最大的都是至强系列的x86-64产品,占了一半还多。然后新加入的超算,大部分都是x86-64的cpu+gpu的异构加速卡组成的。至于金字塔顶尖的顶尖超算已经走向完全异构众核结构了。
而目前,美国的性能怪兽frontier以横扫之势拿下第一,算力超过身后468台的总和。
已经霸榜两年,完成四连冠的本子富岳终于跌落了“神坛”。
在刚刚公布的全球超算top5名单中,美国橡树岭国家实验室(ornl的frontier夺得第一。
其凭借112exaflop/s的hpl分数,frontier不仅是有史以来最强大的超级计算机,它也是第一台真正的“e级超算”。
除了如此炫目的算力之外,frontier还是全球跑ai最快的超级电脑之一。在hpl-ai基准的混合精度性能测试中,frontier跑出了688exaflops的成绩。
这个性能相当于,给一个86亿神经元组成的智能体中的每个神经元,每秒都下达68万个指令。
用这个训练ai大模型,那可真是火箭发动机搭上了一级方程式赛车,可以直接在赛道上起飞。
全新的frontier占地372平方米,由74个hpecrayex机柜组成,可容纳948个节点。
其中,每个节点有一个amdmilan“trento”7a53epyccpu,搭配512gbddr4内存和4个amdradeoninstinctmi25xgpu。
总的来说,该系统有62,112个cpu核心,与46pb的ddr4内存相连接。
此外,37,888个amdmi25xgpu具有8,138,24个核心,并搭配了46pb的hbm内存(每个gpu有128gb。