簡介: 3月21日,2022英偉達(dá) GTC 大會(huì)即將拉開帷幕。此次 GTC 22 大會(huì)上,阿里云將帶來有關(guān)推理優(yōu)化/部署、深度學(xué)習(xí)編譯器、大模型部署、訓(xùn)練優(yōu)化、云手游等主題的內(nèi)容,分享云端機(jī)器學(xué)習(xí)平臺(tái)最新的創(chuàng)新實(shí)踐。
3月21日,2022英偉達(dá) GTC 大會(huì)即將拉開帷幕。此次 GTC 22 大會(huì)上,阿里云將帶來有關(guān)推理優(yōu)化/部署、深度學(xué)習(xí)編譯器、大模型部署、訓(xùn)練優(yōu)化、云手游等主題的內(nèi)容,分享云端機(jī)器學(xué)習(xí)平臺(tái)最新的創(chuàng)新實(shí)踐。
GTC 22 阿里云精彩演講提前看
[S41068] PaiSparse:面向深度學(xué)習(xí)的稀疏加速庫
· 李與超,阿里云,高級(jí)算法工程師
· 朱斐文,NVIDIA, 高級(jí)算法專家
· 3 月 23 日 星期三 | 3:00 PM - 3:25 PM 北京時(shí)間
隨著超大語言模型的流行, 如何部署超大模型正在成為迫切需要解決的問題。非結(jié)構(gòu)化剪枝可以將模型規(guī)模縮小99%,讓超大語言模型在單卡上部署成為可能。然而超大模型稀疏后會(huì)呈現(xiàn)不同的非零分布,而這些分布會(huì)直接影響硬件的計(jì)算量并影響最終的執(zhí)行時(shí)間。同時(shí)與傳統(tǒng)的 HPC 任務(wù)不同的是,基于訓(xùn)練后的稀疏矩陣分布的 tuning 在深度學(xué)習(xí)推理中是可以進(jìn)行的。因此我們提出一個(gè)面向深度學(xué)習(xí)的稀疏加速庫:PaiSparse,可以自動(dòng)生成更高效的稀疏算子。實(shí)驗(yàn)表明,與 cuSparse 相比,PaiSparse 可以提速1.5~5倍。
話題鏈接:https://www.nvidia.com/gtc/session-catalog/#/session/1634303703593001XjhX
[S41501] PTXC:使用 XLA 編譯器通過云 GPU 擴(kuò)展 PyTorch 訓(xùn)練
· 劉小勇,高級(jí)主任工程師
· 3 月 23 日 星期三 | 9:00 PM - 9:25 PM 北京時(shí)間
在工業(yè)界實(shí)踐中,模型訓(xùn)練和部署的效率、規(guī)模和適配性關(guān)系到最終的應(yīng)用效果。為滿足PyTorch eager-first 的 GPU 編譯流程,Lazy Tensor 架構(gòu)被提出來。通過采用實(shí)踐驗(yàn)證過的產(chǎn)品化 XLA 編譯器和分布式引擎,PTXC 能在阿里云 GPU 集群中以基于編譯優(yōu)化的方式一鍵快速搭建易用、彈性且高效的 PyTorch 模型訓(xùn)練系統(tǒng)。
話題鏈接:https://www.nvidia.com/gtc/session-catalog/#/session/1637553159784001rkUB
[S41395] 通過 PAI-Blade 更易用、更可靠地使用 TensorRT
· 邱俠斐,阿里云,主任工程師
· 郭天佑,阿里云,高級(jí)工程師
· 李瀾博,阿里云,高級(jí)工程師
· 3 月 24 日 星期四 | 9:00 AM - 9:25 AM 北京時(shí)間
TensorRT 是英偉達(dá)推出的業(yè)界領(lǐng)先的推理加速器,在深度學(xué)習(xí)推理場景應(yīng)用廣泛,但是通過 TensorRT 來優(yōu)化深度學(xué)習(xí)模型仍有一定門檻。首先,通過 TensorRT 解析模型時(shí)會(huì)遇到轉(zhuǎn)換失敗或表現(xiàn)不理想的情況。其次,從零開始搭建網(wǎng)絡(luò)比較耗時(shí)且難以擴(kuò)展。此外,在生產(chǎn)環(huán)境里增加新的推理框架需要嚴(yán)謹(jǐn)?shù)脑u(píng)估。本次演講將介紹如何通過一站式 AI 加速器 PAI-Blade 解決上述問題。PAI-Blade 能夠?qū)崿F(xiàn) TensorRT 后端上的自動(dòng)圈圖和自動(dòng)化運(yùn)行。同時(shí)還可以與 TensorRT Plugin 協(xié)同工作,以實(shí)現(xiàn)更好的性能。目前 PAI-Blade 提供對 TensorFlow 和 PyTorch 的產(chǎn)品化支持。
話題鏈接:https://www.nvidia.com/gtc/session-catalog/#/session/1635516028378001Pxlx
[S41604] 未來游戲趨勢:通過阿里云彈性云手機(jī)解決方案打造云游戲
· 楊銘,阿里云,高級(jí)工程師
· 3 月 24 日 星期四|11:00 AM - 11:25 AM 北京時(shí)間
基于英偉達(dá) T4 及原生的 ARM 平臺(tái),阿里云設(shè)計(jì)研發(fā)了高性能的云手游解決方案——彈性云手機(jī),可實(shí)現(xiàn)虛擬化渲染及顯存隔離,在確保隔離的情況下充分發(fā)揮 T4 性能。此外,彈性云手機(jī)無縫對接阿里巴巴云游戲流媒體平臺(tái),該平臺(tái)兼容多種流媒體協(xié)議,并具備完整的“渲染-編碼-串流”云手游架構(gòu)。
話題鏈接:https://www.nvidia.com/gtc/session-catalog/#/session/1638429961776001IhJm
[S41383] 云端 Triton 生產(chǎn)實(shí)踐
· 李文鵬,阿里云,主任工程師
· 邱俠斐,阿里云,主任工程師
· 李瀾博,阿里云,高級(jí)工程師
· 3 月 24 日 星期四 | 1:00 PM - 1:25 PM 北京時(shí)間
Triton 推理服務(wù)器是一款功能全面、可擴(kuò)展且功能強(qiáng)大的推理解決方案,在邊緣設(shè)備和云上皆可部署。在云上將 Triton 部署到生產(chǎn)環(huán)境中時(shí),應(yīng)考慮效率、可擴(kuò)展性以及與 Triton 自身外的云上基礎(chǔ)設(shè)施的集成。我們將介紹在阿里云中通過 PAI- EAS 提供 Triton 作為云服務(wù)的關(guān)鍵見解:1) 一鍵部署 Triton 集群;2) 根據(jù)請求吞吐量擴(kuò)展 Triton 集群;3) 與 OSS(對象存儲(chǔ)服務(wù))原生集成;以及 4) Triton 和 GPU 共享調(diào)度。
話題鏈接:https://www.nvidia.com/gtc/session-catalog/#/session/1635349148436001gNSE
[S41073] 阿里云基于 AI 編譯器的通用透明性能解決方案
· 朱凱,阿里云,主任工程師
· 3 月 24 日 星期四 | 2:00 PM - 2:50 PM 北京時(shí)間
本次演講將從云服務(wù)廠商的視角,分享在云端和機(jī)器學(xué)習(xí)平臺(tái)上大規(guī)模部署 AI 編譯器的實(shí)戰(zhàn)經(jīng)驗(yàn)。我們將詳細(xì)介紹近期剛剛開源的動(dòng)態(tài) shape 深度學(xué)習(xí)編譯器 BladeDISC,包括它的背景和主要特性,具體設(shè)計(jì)架構(gòu)和實(shí)現(xiàn)細(xì)節(jié),動(dòng)態(tài) shape 語義下的性能優(yōu)化經(jīng)驗(yàn),未來計(jì)劃以及在 NVIDIA 設(shè)備上的應(yīng)用等。
話題鏈接:https://www.nvidia.com/gtc/session-catalog/#/session/1634431966251001JhrZ
GTC 22 阿里云精彩演講鎖定攻略!
1. 點(diǎn)擊訪問 GTC 22 官網(wǎng) https://www.nvidia.cn/gtc-global/?ncid=GTC-NVMAGGIEJ
2. 注冊 GTC 22
3. 登錄后可將會(huì)議添加至?xí)h日程如下圖
4. 開始后登錄即可觀看會(huì)議,若錯(cuò)過直播時(shí)間,可登錄查看會(huì)議點(diǎn)播,隨時(shí)觀看會(huì)議

掃描下方海報(bào)二維碼,即刻注冊 GTC 22,了解阿里云關(guān)于推理優(yōu)化/部署、深度學(xué)習(xí)編譯器、大模型部署、訓(xùn)練優(yōu)化、云游戲等主題的精彩分享。

星空人工智能技術(shù)網(wǎng) 倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)等問題,煩請30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時(shí)溝通與處理。!:首頁 > 新聞 » GTC22精彩看點(diǎn)|鎖定阿里云硬核分享