久久久国产精品视频_国产成人精品日本亚洲专_日本午夜大片免费观看视频_97av麻豆蜜桃一区二区

首頁 > 活動線報 > 每日福利 > 邊緣大模型狂飆落地!清華系GPGPU驚艷WAIC“六邊形戰士”處理器

邊緣大模型狂飆落地!清華系GPGPU驚艷WAIC“六邊形戰士”處理器

發布時間:2024-07-08 17:35:11來源: 15210273549

在前天,國內最高規格的AI產業盛會第七屆世界人工智能大會(WAIC 2024)開幕,展區已成“大模型”主場,各路玩家隔空斗法。

既有聞名業界的通用大模型大秀生成、理解能力,在金融、醫療等諸多領域施展拳腳的行業大模型,還有能直接部署在PC、服務器等邊緣設備的端側大模型效果驚艷。

可以看到從去年至今,大模型產業的發展焦點正在從技術突破向落地應用外延。一方面,通用大模型表現驚艷,另一方面,距離用戶更近且性能已經足夠強大的端側大模型呈現出規模化應用潛力。

在這之中,隨著技術的成熟和應用場景的拓展,端側大模型市場已經成為AI領域的一個重要增長點,而端側大模型走向落地部署背后的一個關鍵角色就是底層芯片玩家。


WAIC上,一家清華系GPGPU創企的展臺上,我們看到其AI加速卡AzureBlade K340l已經可以支撐大模型跑在AI PC等設備上,并已經適配Llama 3-8B、Stable Diffusion、通義千問等開源模型。

這家創企的技術實力不容小覷。本月初,芯動力科技團隊聯手帝國理工、劍橋大學、清華大學、中山大學等頂尖學府的計算機架構團隊,共同撰寫的論文《Circular Reconfigurable Parallel Processor for Edge Computing》(RPP芯片架構)成功被第51屆計算機體系結構國際研討會(ISCA 2024)的Industry Track收錄。


據了解,Industry Track的錄取接收率僅為15.3%。同時,芯動力科技還受邀在ISCA 2024會議上發表演講,與Intel、AMD等國際知名企業同臺交流。


在WAIC上,我們可以看到以芯動力科技為代表的國內AI芯片玩家,已經亮出了諸多技術成果與案例演示,為端側大模型部署落地裝上了加速引擎。

 

01.

“六邊形戰士”RPP架構

破局邊緣大模型落地

大模型加速落地應用現在已經成為共識,不過通用大模型很難理解企業的真實痛點,讓企業真正用上大模型實現降本增效是當前的重中之重。

但相比于面向消費者的AI工具,企業對于大模型能力的要求更高,除了大模型本身的性能表現需要足夠優越外,還有更為重要的幾點就是數據安全、響應夠快,這也是跑在云上的大模型缺少的。

因此邊緣大模型脫穎而出,因為邊緣設備距離企業的業務或者用戶本身距離更近,且能夠支持本地私有化部署保證用戶的數據安全。與此同時,底層的AI芯片就稱為AI落地邊緣端的必要條件。

這也導致邊緣大模型部署對AI加速卡的特性提出了更高要求。因為邊緣端往往只有一個獨立設備,因此就需要芯片需要同時兼顧體積小、性能強、功耗低。當下Llama系列、通義千問等開源模型,已經在較小的參數規模下達到了較好的性能,能夠實現很好的文升文、文生圖效果。這也為大模型在端側落地提供了機會。

還有更為重要的一點是,大模型的技術突破仍在不斷革新。為了讓大模型在資源有限的設備上部署,大模型量化部署精度正在從8bit向4bit支持,大模型的快速演變對芯片研發的長周期,大投入提出了不小的挑戰。

這些難題在對芯片的性能及靈活性提出不小挑戰的同時,也是大模型落地的必要條件。對于眾多專用芯片來講,這意味著需要開展全新的芯片設計工作,而對芯動力科技可重構并行處理器架構(RPP)來講,則僅需進行一次軟件開發即可。在面對邊緣大模型落地所面臨的難題時,芯動力科技的RPP架構展現出其固有的天然優勢。

在生成式AI日新月異的應用場景中,唯一不變的就是變化本身。芯動力構建的通用性生態決定了,未來若出現除Transformer以外的新型算法基底,RPP架構將能夠迅速完成算法的兼容與優化,而無需改變硬件架構。這使得RPP架構擁有更持久的生命力和更廣闊的市場前景。

RPP架構是針對并行計算設計的芯片架構,芯動力將其稱作“六邊形戰士”。這一架構既結合了NPU的高效率與GPU的高通用性優勢,更具備DSP的低延時,可滿足高效并行計算及AI計算應用,如圖像計算、視覺計算、信號處理計算等,大大提高了系統的實時性和響應速度。

芯動力首款基于可重構架構的GPGPU芯片RPP-R8每顆芯片內含有1024個計算核,相比傳統GPU架構在同樣的算力占用更小的芯片面積,實現了低功耗和高能效的有效平衡。RPP-R8除了具備專用芯片所沒有的通用編程性,面積效率比可達到同類產品的7~10倍,能效比也超過3倍。

 

每日福利更多>>

不讓吹“智駕”后亂了套,上海車展變成“雜耍”現場? 智能進化,科技驅動:寶馬新世代車型定義未來汽車 看到極氪9X的“豪”,更不能忽視極氪V4極充兆瓦樁的“強” 全球化出發的大局觀,為長安汽車加碼國際化賦能 納米06購車手冊:小型純電SUV,智能化是亮點,推薦401 Ultra版 4月第四周銷量榜:零跑超越理想再奪冠,問界大漲重回前五 上海車展最吸睛的展臺,iCAR方盒子矩陣,總有一款讓你種草 上海車展里,15萬內可以閉眼買的SUV,只有iCAR V23? 廣汽傳祺以“向往”叩開智電高端大門 現在買路虎還來得及嗎? 極越能否真的迎來轉機? 2025上海車展上演“消失的TA”! 極越疑獲得“復活甲”:將不破產,目前3-4家在談重組 2025年1-3月中國占世界汽車份額33% 長安凱程 V919 開啟預售!共推出 8 款車型,預售價 11.99 萬元起 領克900上市把服務器都干崩了!它憑什么成為萬人迷? 錨定長期主義:從上海車展看長城的戰略縱深 納米 06 正式開啟預售!共推出 5 款車型,有望二季度上市 挑戰 GPT!微軟新 AI 模型 Phi-4 驚艷亮相,打破參數迷信 微軟財季業績強勁增長,核心業務實現兩位數增幅 全球PC市場回暖 國補推動廠商加速筆記本電腦產品創新 4月交付41039臺,位居新勢力第一,零跑為何能屢獲消費者追捧? 小鵬汽車:4月交付新車35,045臺 同比增長273% 要求理想開放超充,不如勸“可油可電”多用汽油 6萬級純電市場再添猛將!埃安UT 330星輝版開啟超值購車新體驗 記者在一線丨數字+寵物!2025年快手全國寵物節在立山區舉辦 拼多多領現金活動,是真的嗎? 三美教育集團首落五象!南寧學區格局生變,這些樓盤或迎潑天富貴 4月樓市結構性回暖!新房溢價與二手房讓利,背后市場變局是啥? 上海房價4月跌幅top20