久久久国产精品视频_国产成人精品日本亚洲专_日本午夜大片免费观看视频_97av麻豆蜜桃一区二区

首頁 > 活動線報 > 每日福利 > 千億大模型極限吞吐8268 token/s!聯想AI服務器性能再度打破記錄

千億大模型極限吞吐8268 token/s!聯想AI服務器性能再度打破記錄

發布時間:2025-04-11 22:15:34來源: 12055991234

近日,聯想研究院智能計算基礎設施實驗室(ICI Lab)與聯想中國基礎設施業務群緊密協作,成功推出了一系列聯想問天DeepSeek推理一體機,實現了單機部署DeepSeek 671B滿血版大模型極限吞吐8268詞元/秒(token/s),千億參數大模型本地部署顯存需求低于1TB

這一成果刷新了業界單臺服務器運行大模型性能的紀錄,為AI服務器大模型推理性能指標樹立了新的標桿,充分彰顯了聯想在AI智算基礎設施領域的深厚技術底蘊與領先實力。

 

此次突破性進展由聯想研究院智能計算基礎設施實驗室(ICI Lab)異構計算團隊攜手聯想中國基礎設施業務群,并聯合AMD共同設計實現。依托在智算基礎設施關鍵技術領域的持續積累,ICI Lab異構團隊針對DeepSeek大模型推理進行了全方位的技術創新與優化,涵蓋了高層編譯優化、集合通信優化以及分布式推理引擎優化等多個關鍵領域,極大提升了大模型的推理效率和性能。

高層編譯優化:深入分析負載特征和硬件架構,對MLA 和 GEMM kernel 算子性能進行了全面優化,顯著提高運算速度,從而加快模型的推理過程。同時,通過自適應混合精度量化在不同計算精度之間靈活切換,在保證模型精度的同時,節省了大量的算力和顯存資源,使得模型能夠在有限的硬件資源下高效運行,充分釋放硬件算力潛能。

集合通信優化: 自主研發的LCCL集合通信庫通過優化通信算法和數據傳輸策略,特別是針對分布式推理中的ALLReduce和ALLtoALL等關鍵操作進行了深度優化,有效減少了通信延遲和帶寬占用,提高了分布式推理的效率。

分布式推理引擎優化:單次生成多Token并行輸出,突破傳統序列解碼顯示,大幅提升了解碼階段的并行化水平。利用GPU/CPU協同推理機制通過動態調度算力負載,將GPU存算負載卸載至CPU,充分發揮異構算力效率。采用PD分離式推理架構將預填充與解碼階段分離,并分別適配不同硬件進行優化,滿足高并發大規模業務場景需求。

每日福利更多>>

三星QLED電視榮獲德國萊茵TÜV“真實量子點顯示”認證 iPhone 16大降價,華米OV該哭還是該笑? 5G-A速率10倍提升!廣東正加速部署,手機信號多個“A”有何作用? 誕生至今七十余年 終于有人要對隱藏式門把手“下手”了 真挖孔,真散熱,法拉利如何打造296 Speciale高性能版 冰火兩重天!1-4月新勢力成績單:小鵬唯一“及格”,蔚來為何墊底? 廣汽領程 GAC PICKUP 01 量產版將于 2027 年上市! 新款星途星紀元 ES純電版將于5月18日上市_電車之家 多元布局本土化創新,東風汽車品牌加速全球化進程 確定了,全新寶馬iX3將9月首發,國產還會加長 股票證券公司服務費可以退款嗎?會員費是可以退!誘騙繳費能全額退 退款流程!5月成功維權退款流程方法分享! 2025年巴中市巴州區事業單位選調工作人員公告 2025年綿陽市三臺縣委社會工作部招聘社區工作者公告 2025年四川省生態環境監測總站招聘勞務人員公告 2025年瀘州市合江縣招聘教師補充公告 2025年雅安市中醫醫院招聘高學歷及急需緊缺專業人員公告 2025年眉山市教育科學研究所選調事業人員的公告 2025年成都蒲江縣事業單位考試公告(14名) 2025年成都市大邑縣事業單位考試公告(30名) 2025年成都市崇州市衛生健康局所屬事業單位招聘工作人員公告 2025年成都市彭州市衛生健康局所屬事業單位招聘工作人員公告 2025年成都市彭州市所屬事業單位招聘考試公告(45名) 2025年成都市簡陽市所屬事業單位招聘考試公告(35名) 2025年成都市雙流區衛生健康局所屬事業單位招聘工作人員公告 2025年成都市青白江區所屬事業單位招聘考試公告(12名) 2025年成都青羊區事業單位招聘考試公告(20名) 2025年成都職業技術學院招聘工作人員公告 2025年成都市殘疾人聯合會所屬事業單位招聘工作人員公告 2025年成都市體育局所屬事業單位招聘工作人員公告 2025年成都市衛生健康委員會所屬事業單位招聘工作人員公告