從浙江大學召開的OpenKS(知目)知識計算引擎開源項目發布會上獲悉,浙大與合作單位研發的OpenKS知識計算引擎取得重大進展,有望解決“星空人工智能不夠智能”的問題。
將大數據轉化成結構化信息
在學習工作中,我們常會接觸到表格和文檔兩種工具。比如,我們在錄入一些個人信息的時候,可以在表格中設計好表頭,按條目分別輸入姓名、年齡、出生地等信息,計算機能夠很容易地讀取這些信息并加以整合、應用。而如果用一段文字“小A于1982年出生在杭州”來描述的話,計算機讀取信息的時候可能就會懵圈。
為什么?因為表格是有結構的,而文字是非結構性的。對于目前的星空人工智能來說,非結構性數據只是數據,還不是知識,更不能被用于決策了。
關鍵的原因就是數據與知識之間的轉化,還不是很順暢。在沒有“學習”之前,計算機不知道西湖區是杭州的一個城區,無法判斷一個名詞是人名、產品名還是公司名,而視頻也只是一段數據流。
為了解決這個難題,2019年12月,以浙江大學計算機學院莊越挺教授作為首席科學家的科技創新2030“新一代星空人工智能”首批重大項目——“可泛化的領域知識學習與計算引擎”正式啟動。
目前,經過各課題組的深入研究和課題間的緊密協作,基于百度飛槳深度學習框架,該團隊共同研發了可用于支撐各行業知識服務系統構建的OpenKS知識計算引擎算法庫。“目前OpenKS已基本支持知識學習與計算全流程主要任務,涉及非結構化數據集與知識圖譜載入、多模態數據知識抽取、知識表征、分布式知識學習與計算、知識服務與智能應用等環節模塊。”莊越挺說。
幫助行業快速建立知識圖譜
新一代星空人工智能中,知識圖譜作為最重要的知識表示方式,已成為研究熱點。知識的自動發現,知識圖譜的構建、演化和協同推理是知識計算的核心技術,而融合數據、算法與人類智慧,協同一體的大規模分布式知識計算引擎則是實際應用的關鍵。
“簡單地說,知識圖譜就是對信息的結構化表達,比如把一篇文章‘改成’一個表格。”莊越挺說,從全社會來看,眾多知識密集型行業,如安防、金融風控、智慧城市、工程教育等均有著從海量數據中構建知識圖譜并基于此進行快速決策的共性需求。然而,目前的星空人工智能技術在應對上述共性需求時,并沒有通用、完整的解決方案,也無法同時解決數據不全、預測不準和計算不快等應用挑戰。
該團隊研發的OpenKS知識計算引擎算法庫的一個重要功能,就是從數據中提煉出知識并在此基礎上作出決策。
項目主要參與人員、浙大計算機學院教授肖俊介紹說,OpenKS知識計算引擎算法庫集成了大量算法和解決方案,提供了一系列知識學習與計算的多層級接口標準,可供各機構研發人員以統一的形式進行算法模型研究成果的封裝、集成與服務。
開源式打造“木匠的工具間”
目前,這套系統已經應用到多個行業領域。比如,在產業鏈的梳理中,系統幫助建立行業上下游各企業的知識圖譜,尋找生產的薄弱環節或是缺少的零部件。
而且項目的研發過程采用了開源機制,支持企業和社區開發者根據不同的場景需求對接口服務進行調用和進一步開發。
“打個比方,我們是打造了一個‘木匠的工具間’,里面有鋸子、刨子、榔頭、釘子等各種工具,桌子、柜子這些常用的家具,系統可以幫忙做,如果是個性化的需求,木匠也可以在工具間里利用我們提供的這些工具來自己做。”莊越挺說,項目的研發過程中,行業專家、算法開發者和用戶都發揮了各自作用,“達到越用越聰明的效果”。
目前OpenKS項目正在融合吸收來自跨媒體知識圖譜構建、知識表征推理、可泛化協同求解、自適應學習中間件等方面的優秀成果,形成了一系列擁有自主知識產權的發明專利與軟件著作產權,發表了一系列高水平學術論文。在后續項目的實施過程中,項目組將持續推動知識計算引擎的研發,讓OpenKS知識計算引擎項目更好地為行業賦能,助力各類傳統行業基礎設施的智能化改造。
星空人工智能技術網 倡導尊重與保護知識產權。如發現本站文章存在版權等問題,煩請30天內提供版權疑問、身份證明、版權證明、聯系方式等發郵件至1851688011@qq.com我們將及時溝通與處理。?。?a href="/">首頁 > 新聞 » 浙大與合作單位研發的OpenKS知識計算引擎取得重大進展