3月17日,聯(lián)想集團有限公司(以下簡稱“聯(lián)想”)宣布旗下首款A(yù)MD AI大模型訓(xùn)練服務(wù)器聯(lián)想問天WA7785a G3在單機部署671B(滿血版)DeepSeek大模型,可實現(xiàn)極限吞吐量6708token/s,將單臺服務(wù)器運行大模型的性能推向了新高,展現(xiàn)了聯(lián)想在AI基礎(chǔ)設(shè)施領(lǐng)域技術(shù)的深厚積淀與研發(fā)的快速響應(yīng)能力。在AI算力競爭日趨白熱化的今天,聯(lián)想再次以硬核技術(shù)實力樹立了行業(yè)新標桿。
依托聯(lián)想萬全異構(gòu)智算平臺,聯(lián)想通過訪存優(yōu)化、顯存優(yōu)化等諸多創(chuàng)新方式,對大模型從預(yù)訓(xùn)練、后訓(xùn)練到推理的全流程進行持續(xù)優(yōu)化。相關(guān)成績意味著單臺聯(lián)想問天WA7785a G3可以支撐1500人規(guī)模企業(yè)的正常使用,是繼聯(lián)想問天WA7780 G3服務(wù)器單機部署滿血版DeepSeek大模型總吞吐量突破2500 token/s之后,單機部署該大模型推理性能的又一次突破。
此次突破是聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群、聯(lián)想研究院ICI實驗室和AMD聯(lián)合設(shè)計、協(xié)同調(diào)優(yōu)、共同實現(xiàn)的。據(jù)了解,聯(lián)想與AMD還在持續(xù)嘗試深度調(diào)優(yōu)新方法,實現(xiàn)更高調(diào)優(yōu)突破。
該款聯(lián)想問天服務(wù)器具有強大算力引擎、超大顯存、特有創(chuàng)新架構(gòu)等優(yōu)勢,為服務(wù)器的穩(wěn)定性和可靠性提供了有力保障。
據(jù)了解,聯(lián)想將持續(xù)深化與產(chǎn)業(yè)伙伴的技術(shù)協(xié)作,通過架構(gòu)創(chuàng)新、算法優(yōu)化與硬件技術(shù)創(chuàng)新,不斷突破性能邊界,為各行業(yè)提供更高密度、更低能耗、更易部署的AI算力基礎(chǔ)設(shè)施,推動AI算力向更高效、更普惠、更可持續(xù)的方向演進,助力中國智算產(chǎn)業(yè)的持續(xù)發(fā)展。