97视频在线观看免费高清完整版在线观看-69精品人人人人-爱的色放3-亚洲黄色一区-亚洲精品视频免费在线观看-男人天堂免费视频-久久久社区-日韩综合一区二区-色撸撸在线-蝌蚪av-国产乱淫视频-男生尿隔着内裤呲出来视频-人操人操-欧美鲁鲁-免费视频99-3级av-中国一级大黄大黄大色毛片-久久久欧美精品-99精品在线看-色峰视频-印度毛茸茸-国产福利毛片-国产极品999-69日韩-天天综合网国产

阿里云機器學習平臺PAI與華東師范大學論文入選SIGIR 2022

2022-07-11 15:14:04 小編：新龍1 分類：新聞信息來源：閱讀()

近日，阿里云機器學習平臺PAI與華東師范大學高明教授團隊合作的論文《結構感知的稀疏注意力Transformer模型SASA》被頂會 SIGIR 2022錄取。論文主導通過引入稀疏自注意力的方式來提高Transformer模型處理長序列的效率和性能，并提出了結合代碼語言和結構特性的面向長代碼序列的Transformer模型性能優化方法。

SIGIR是星空人工智能領域智能信息檢索方向頂級國際會議，涉及搜索引擎、推薦系統等多個方向，該會議曾推動了面向搜索的排序模型、基于深度學習的推薦算法等星空人工智能領域的核心創新，在學術和工業界都有巨大的影響力。此次入選意味著阿里云機器學習平臺PAI自研的稀疏注意力Transformer模型達到了業界先進水平，獲得了國際學者的認可，展現了中國機器學習系統技術創新在國際上的競爭力。

那么SASA主要解決了什么問題？基于Transformer的模型在self-attention模塊的復雜度隨序列長度呈次方增長，多數編程預訓練語言模型（Programming-based Pretrained Language Models, PPLM）采用序列截斷的方式處理代碼序列，從而導致上下文信息缺失。

針對以上問題，SASA設計了四種稀疏注意力模式，包括：sliding window attention，global attention，Top-k attention，AST-aware attention，在一定程度上將計算復雜度與序列長度解耦。其中sliding window和Top-k模式基于局部上下文和重要的attention交互學習表示，抽象語法樹（AST）模式引入代碼的結構特性，與序列上下文信息相互補足，global attention通過與序列中所有token進行交互來獲取全局信息。對比CodeBERT，GraphCodeBERT等方法，SASA在多個長代碼任務上取得最佳效果，同時也降低了內存和計算復雜度。

SASA技術將在開源框架EasyNLP中集成，給PAI的NLP開發者提供基于稀疏注意力機制的長序列自然語言處理能力。機器學習平臺PAI面向企業客戶級開發者，提供輕量化、高性價比的云原生機器學習，涵蓋PAI-DSW交互式建模、PAI-Designer可視化建模、PAI-DLC分布式訓練到PAI-EAS模型在線部署的全流程。

論文信息

EasyNLP開源地址：https://github.com/alibaba/EasyNLP

論文鏈接：https://arxiv.org/abs/2205.13730

論文名字

Understanding Long Programming Languages with Structure-Aware Sparse Attention. SIGIR 2022

論文作者

劉婷婷，汪誠愚，陳岑，高明，周傲英

繼續閱讀：

星空人工智能技術網倡導尊重與保護知識產權。如發現本站文章存在版權等問題，煩請30天內提供版權疑問、身份證明、版權證明、聯系方式等發郵件至1851688011@qq.com我們將及時溝通與處理。！：首頁 > 新聞 » 阿里云機器學習平臺PAI與華東師范大學論文入選SIGIR 2022

相關推薦