近日,備受矚目的萬億參數大模型Ling-1T正式上架華為云大模型即服務MaaS平臺,Ling-1T是百靈大模型系列的首款旗艦級“非思考”模型,擁有萬億參數,并已開源。此次模型上架支持專屬資源部署,依托華為云領先的AI算力基礎設施,全面釋放Ling-1T模型卓越能力。
Ling-1T是一款擁有萬億級總參數的非思考模型,作為百靈大模型Ling 2.0系列的旗艦力作,其每個token可激活約50B參數。模型基于先進的Ling 2.0架構,在超過20T tokens的高質量、高推理濃度語料上完成預訓練,并支持高達128K的上下文窗口。

通過創新的“中訓練+后訓練”演進式思維鏈(Evo-CoT)技術,Ling-1T在多項國際權威的復雜推理基準測試中,如代碼生成、軟件開發、專業數學及邏輯推理等,均取得了業界頂尖(SOTA)的表現,Ling-1T在有限輸出token條件下,于多項復雜推理基準中取得SOTA表現,展示出模型兼顧推理效率與準確性。
Ling-1T模型與CloudMatrix384 超節點在架構、性能和部署上存在高度互補。Ling-1T作為高效推理的模型,可充分利用CloudMatrix384 超節點為大規模MoE模型提供的加速和優化,在實際應用中發揮出更強的性能。
MoE架構與全對等互聯:Ling-1T模型采用MoE(混合專家)架構。MoE模型的核心在于稀疏激活機制,分布式部署時會產生大量All-to-All通信需求,而傳統網絡架構難以高效處理。CloudMatrix384 超節點通過全對等互連架構,高度契合MoE模型的通信密集型需求,有效避免通信瓶頸。
專家并行與動態負載均衡:Ling-1T模型由256個專家模塊組成,模型推理時需激活約50B參數,推理過程會產生大量網絡通信。CloudMatrix384 超節點通過超高速互聯網絡與基于內存語義的零拷貝數據聚合技術,有效突破大規模專家并行計算中的通信瓶頸,為超大規模語言模型推理提供高可靠、低延遲的端到端算力支持,從而在超節點上實現Ling-1T的高吞吐量和低延遲推理任務。
華為云大模型即服務MaaS平臺已預置DeepSeek、Qwen3、Kimi等業界主流開源大模型,并基于昇騰AI云服務完成深度適配與優化,模型部署和運行在云端,無需自行處理復雜的硬件和部署問題,用戶可通過API接口可快速調用LLM、多模態等模型服務。Ling-1T作為新的旗艦模型入駐,將為用戶提供更強大、多樣化的大模型選擇。
星空人工智能技術網 倡導尊重與保護知識產權。如發現本站文章存在版權等問題,煩請30天內提供版權疑問、身份證明、版權證明、聯系方式等發郵件至1851688011@qq.com我們將及時溝通與處理。!:首頁 > 星空人工智能產業 > AI大模型 » 萬億參數模型「Ling-1T」正式上架華為云,昇騰AI云服務釋放澎湃算力