知識圖譜是從大數(shù)據(jù)走向人工智能的階梯,是人工智能走向可解釋的認知智能的基礎(chǔ)。隨著知識圖譜技術(shù)的發(fā)展,對行業(yè)中多源異構(gòu)數(shù)據(jù)的整合,大規(guī)模行業(yè)知識挖掘以及更加廣泛的知識智能化應(yīng)用具有重要指導(dǎo)意義。
作為底層AI的重要技術(shù)之一,知識圖譜可用于迅速描述事物的概念及其相互關(guān)系,而且被廣泛應(yīng)用于智能搜索、智能問答、個性化推薦、情報分析、反欺詐等領(lǐng)域。知識圖譜的基礎(chǔ)是數(shù)據(jù),也是數(shù)據(jù)能力最為直接的體現(xiàn)。
軟通動力基于知識圖譜開發(fā)的構(gòu)建工具和管理平臺,將行業(yè)中多源異構(gòu)的數(shù)據(jù)和多維復(fù)雜的關(guān)系進行處理與可視化展示,讓大數(shù)據(jù)與AI任務(wù)進行有效連接,可為用戶提供有效領(lǐng)域知識整合,挖掘利益與價值鏈條,輔助決策、預(yù)測分析的能力。
近年,公司將知識圖譜構(gòu)建能力向智能出行、物流、旅游等行業(yè)中推廣,使其形成相關(guān)領(lǐng)域的知識圖譜。其中,軟通動力助力客戶構(gòu)建的標準地址庫知識圖譜是由一系列圖譜技術(shù)原子能力和工具組成,可以將企業(yè)以及區(qū)域地址數(shù)據(jù)通過Neo4j圖數(shù)據(jù)庫存儲轉(zhuǎn)換為圖譜知識,對圖譜知識進行統(tǒng)計、管理和根據(jù)輸入的問題在圖譜中檢索答案。相對比傳統(tǒng)關(guān)鍵詞搜索,基于知識圖譜的搜索問答,可以使結(jié)果更加準確,知識圖譜可以展示最全面的信息,能更好地契合用戶的需求,提供更加準確、直接的答案。最終該知識圖譜應(yīng)用形成以城市為單位進行平臺的建設(shè),預(yù)計圖譜的規(guī)模量級在百萬級別。標準地址庫知識圖譜的本體包括企業(yè)和地址兩類,而系統(tǒng)應(yīng)用由3個模塊組成,分別是圖譜知識導(dǎo)入模塊、圖譜知識管理模塊、知識圖譜應(yīng)用模塊。
圖譜知識導(dǎo)入模塊涵蓋了數(shù)據(jù)導(dǎo)入、知識格式檢查、數(shù)據(jù)導(dǎo)入及導(dǎo)入記錄查詢等4種功能。
圖譜知識管理模塊則包括了知識編輯、地址退出以及圖譜可視化等功能,其中知識編輯可對圖譜數(shù)據(jù)的各類編輯需求如地址改名、地址合并、地址新增、地址修改、地址別名修改、企業(yè)機構(gòu)名進行編輯操作。
圖譜應(yīng)用模塊可進行搜索、輸入聯(lián)想、異常地址判斷、地址糾錯、地址抽取以及地址相似判斷等。其中信息提取可以給定一段包含企業(yè)地址的文本,抽取其中的地址并結(jié)構(gòu)化顯示;且該模塊還支持異常地址判定的服務(wù),即給定一段地址后系統(tǒng)可自動判斷該地址是否有誤。按照地址模板檢查地址,檢查各級地址是否都存在,若不存在則補充,并用標準地址對各級地址校準。
目前,軟通動力已形成以數(shù)據(jù)為基礎(chǔ)、知識為牽引、應(yīng)用為驅(qū)動的知識圖譜構(gòu)建能力,其行業(yè)應(yīng)用獲得了相關(guān)客戶的一致好評。在知識圖譜技術(shù)應(yīng)用場景爆發(fā)的當下,軟通動力的知識圖譜構(gòu)建能力不僅能給企業(yè)帶來一個全局的知識庫,還能深度挖掘非結(jié)構(gòu)化地址數(shù)據(jù)價值,激活不同應(yīng)用場景下的數(shù)據(jù)價值,為各行業(yè)的數(shù)字轉(zhuǎn)型、智能升級、融合創(chuàng)新賦能助力。
相關(guān)鏈接:
作為國內(nèi)領(lǐng)先的軟件與信息技術(shù)服務(wù)商,軟通動力致力于用數(shù)字技術(shù)不斷為客戶提升價值,在人工智能領(lǐng)域早有布局,并成立了專注于AI領(lǐng)域的人工智能研究與創(chuàng)新中心(AIC),圍繞自然語言理解、知識圖譜、多輪對話、智能問答、智能推理、自學(xué)習(xí)、數(shù)據(jù)分析等前沿技術(shù)的核心技術(shù)和算法展開應(yīng)用研究與產(chǎn)業(yè)化開發(fā)。
軟通動力AIC從2013年就開始研發(fā)的面向自然語言處理的人工智能技術(shù)平臺,經(jīng)過潛心研發(fā),初步形成了NLP引擎、知識圖譜管理平臺、知識圖譜構(gòu)建工具等三大核心功能模塊,并獲得NLP、深度問答、智能對話、智能推理、深度學(xué)習(xí)、知識圖譜自動構(gòu)建、大數(shù)據(jù)管理等20多項人工智能技術(shù)的專利和軟件著作權(quán)。