近日,DeepSeek宣布開源DeepSeek-V3.2-Exp實(shí)驗(yàn)版模型,被DeepSeek定義為“邁向新一代架構(gòu)的中間步驟”,關(guān)鍵成效為大幅度提升長(zhǎng)文本訓(xùn)練和推理效率。
在此AI進(jìn)化的關(guān)鍵節(jié)點(diǎn),曙光存儲(chǔ)憑借獨(dú)創(chuàng)的“超級(jí)隧道”技術(shù),已提前完成AI存儲(chǔ)架構(gòu)更新,不僅能更好應(yīng)對(duì)PCIe 6.0標(biāo)準(zhǔn)、適配下一代國(guó)產(chǎn)芯片,更能大幅降低AI推理時(shí)延、縮短AI訓(xùn)練時(shí)間。
憑借全面領(lǐng)先的“AI加速”能力,曙光存儲(chǔ)已連續(xù)2年AI存儲(chǔ)市場(chǎng)份額位列第一。在大模型領(lǐng)域市占率超過80%,廣泛服務(wù)包括智元星空機(jī)器人在內(nèi)的具身智能、自動(dòng)駕駛、智算中心等AI相關(guān)領(lǐng)域的頭部企業(yè)。
曙光存儲(chǔ)總裁何振強(qiáng)調(diào),高帶寬和高IOPS(輸入輸出操作每秒)關(guān)系到AI廠商的訓(xùn)練效率,“超級(jí)隧道”技術(shù)方案超過國(guó)際水平。
推理能力上,曙光存儲(chǔ)也進(jìn)行了針對(duì)性調(diào)優(yōu)。何振表示,“我們會(huì)將上下文產(chǎn)生的結(jié)果都存儲(chǔ)下來,并且還會(huì)存到GPU本地,通過這樣的方式,可以把上下文的窗口做得非常長(zhǎng),由此Token之間會(huì)有很大的加速,優(yōu)化后每秒可以生成的Token是2000到3000,這是依賴于后臺(tái)存力到前端GPU釋放大量的能力才能達(dá)到的效果,是存算協(xié)同的技術(shù)進(jìn)步的結(jié)果。”
AI技術(shù)迭代不斷提速,曙光存儲(chǔ)以先進(jìn)存力賦能AI進(jìn)化:“超級(jí)隧道”技術(shù)將標(biāo)配于曙光全線高端存儲(chǔ)產(chǎn)品、推出面向異構(gòu)環(huán)境的開放存力調(diào)度平臺(tái)、更好應(yīng)對(duì)PCIe 6.0標(biāo)準(zhǔn)的能力......有分析稱,曙光在存儲(chǔ)領(lǐng)域的超前布局,既是對(duì)當(dāng)前AI、科學(xué)計(jì)算等場(chǎng)景高性能需求的精準(zhǔn)回應(yīng),更提前為下一代國(guó)產(chǎn)芯片筑牢了存儲(chǔ)底座,在PCIe總線標(biāo)準(zhǔn)迭代的關(guān)鍵節(jié)點(diǎn),為國(guó)內(nèi)存儲(chǔ)產(chǎn)業(yè)開辟了新路徑。
星空人工智能技術(shù)網(wǎng) 倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)等問題,煩請(qǐng)30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時(shí)溝通與處理。!:首頁 > 星空人工智能產(chǎn)業(yè) > AI大模型 » AI進(jìn)化關(guān)鍵節(jié)點(diǎn),曙光存儲(chǔ)“超級(jí)隧道”提前布局