時間:2018年04月03日 分類:科學技術(shù)論文 次數(shù):
在當前對本體語義關(guān)系挖掘映射系統(tǒng)中運用了許多種方法,這對于權(quán)值的選取要高很多,如果選取不當,就不能很好的收獲到語義信息,因而得出的結(jié)果也會差很多。下面文章就主要針對語義挖掘映射策略及權(quán)值展開分析,設(shè)計相應的本體映射原型系統(tǒng),這樣就可以實現(xiàn)本體映射語義關(guān)系挖掘功能,并且獲得正確的結(jié)果,將得到的實驗結(jié)果與先進的映射系統(tǒng)的結(jié)果進行比較,測試系統(tǒng)性能,驗證本系統(tǒng)的有效性。
關(guān)鍵詞:語義關(guān)系,本體映射,挖掘映射系統(tǒng)
1系統(tǒng)目標與模塊設(shè)計
本文設(shè)計的系統(tǒng)稱之為“S-Mapping”語義挖掘映射子系統(tǒng),通過本系統(tǒng)要實現(xiàn)高效率的候選映射集檢索,優(yōu)化的候選映射集。本系統(tǒng)由以下幾個模塊組成。
(1)用戶操作模塊。
提供一種UI操作界面,可供用戶進行界面操作,可以很方便的輸入所需要進行驗證的映射本體,并能對最終結(jié)果進行輸出顯示。
(2)本體解析模塊。
該模塊能對本體的各種特征進行提取解析,針對檢驗本體映射所需要的各種特征值進行預處理,對不同格式的本體做標準化操作,為本體相似度運算以及映射對的最終確定做好初期準備。
(3)本體語義間關(guān)系挖掘模塊。
該模塊是對標準化本體主要用于進行挖掘候選語義關(guān)系,通過語義的初步挖掘,縮小需要比對的樣本范圍,減輕下一步的運算復雜度,并提高最終映射結(jié)果的精準性。
(4)映射結(jié)果輸出模塊。
采用優(yōu)化的自適應映射算法,將得出的結(jié)果進行界面可視化輸出,為后續(xù)的查詢和檢索等提供參考服務。
(5)映射結(jié)果評價模塊。
為了檢驗映射系統(tǒng)的性能,需要對映射結(jié)果進行評價,能自動輸出評估的結(jié)果,根據(jù)這個評價結(jié)果,便于對系統(tǒng)進行改進。
2系統(tǒng)實現(xiàn)
本系統(tǒng)選用Java作為編開發(fā)平臺,Java的與平臺無關(guān)性,便于系統(tǒng)的移植。系統(tǒng)還用了UML、Jena、Alignment等開發(fā)工具。系統(tǒng)采用了一種全新的本體相關(guān)度候選映射集檢索方法,提出了改進了的映射關(guān)系挖掘算法,尤其采用權(quán)值策略的自適應計算,削弱排除干擾信息,突出價值較高的一個語義信息。
為了克服傳統(tǒng)映射系統(tǒng)采用方法存在的缺點,本文結(jié)合本體的標題名稱和自身結(jié)構(gòu)等信息為參考要素,確定映射關(guān)系候選集合,從而準確而且全面的找出不同的本體中的語義概念本文認為,當兩映射關(guān)系對的結(jié)構(gòu)關(guān)系具有全相關(guān)性時,則可在映射關(guān)系候選集合中直接添加目標概念,這樣與該概念相近的周圍概念也將產(chǎn)生更大的加入映射候選集之中;當兩映射關(guān)系對完全無不相關(guān)性時,則可以直接丟棄該概念;除此之外,需要注意的是,目標概念是必須遵循名稱相似度和相關(guān)性衡量指標來加入映射關(guān)系候選集合的。
鑒于此,本文的核心思想是:對源本體和目標本體的概念進一系列預處理操作,如首字母縮寫處理、分詞操作、縮略語查找、排除同名異義以及詞干的抽取等,對于源本體中的任一概念X,經(jīng)過相似性比較操作,在目標本體中找出與源本體名稱最相似的概念Y,然后以Y概念為錨點得到的初始候選概念映射集,然后再進行擴展,最終得到所需要的候選映射關(guān)系的集合。
本系統(tǒng)的關(guān)鍵程序代碼如下:
publicStructrueMatcher(OntClasscls1,OntClasscls2,ExtendedVectorstructureMatchingResult(){
srccls=csl1;
tarcls=cls2;
this.structureMatchingResult=structureMatchingResult;
}
publicbooleanhasSameSuperClass(){
booleanflag=false;
OntClass[]spc1=superClassSet(srccls);
OntClass[]spc2=superClassSet(tarcls);
Outer;
for(inti=0;i<3;i++)
for(intj=0;j<3;j++)
if(spc1[i]!=null&&spc2[j]!=null){
MactchingUnitmu=newMatchingUnit(spc1[i].toString(),spc2[j].toString(),true);
if(structureMatchingResult.contains(mu))
flag=true;
breakOuter;
}
}
}
returnflag;
3系統(tǒng)性能評估實驗
本系統(tǒng)的實驗以O(shè)AEI提供的標準測試數(shù)據(jù)集進行實驗[4],與2007年參加OM國際本體映射測試比賽的系統(tǒng)[5]在查全和查準方面進行比較。
從實驗結(jié)果表1分析可以看出,本系統(tǒng)進行語義搜索耗費的時間要優(yōu)于傳統(tǒng)方法,系統(tǒng)性能較傳統(tǒng)方法有了一定的提升。系統(tǒng)參數(shù)均衡,在有些地方仍有提升的空間,如:選映射集數(shù)目稍低,某些本體信息的處理結(jié)果還不夠理想等。
4結(jié)語
本文針對語義挖掘的映射多策略及權(quán)值計算進行研究,設(shè)計一個本體映射原型系統(tǒng),優(yōu)化改進了本體映射策略,雖然部分處理的結(jié)果還不夠理想,還有提升的空間,但這對于今后開展的本體重用和集成等相關(guān)研究提供了基礎(chǔ),同時也為不同本體概念間的查詢提供了技術(shù)支持。
參考文獻
[1]王家琴,李仁發(fā),李仲生,等.一種基于本體的概念語義相似度方法的研究[J].計算機工程,2007,11(33):201-203.
[2]張芷維.基于語義的本體映射策略以其結(jié)合方式[D].中南大學,2008.
[3]唐杰,梁邦勇,李涓子,等.語義Web中的本體自動映射.計算機學報,2006,11(29):1956-1976.
[4]JayantMadhavanAlonY.Halevy.Composingmappingsamongdatasources[J].VLDB2003:Proceedingsof29thInternationalConferenceonVeryLargeDataBases,LosAltos,USA,2003:572-583.
[5]潘有能,劉朝霞.本體映射技術(shù)在關(guān)聯(lián)數(shù)據(jù)中的應用研究[J].情報科學,2015,33(1):54-56,62.
推薦閱讀:計算機技術(shù)在日常生活中的應用及發(fā)展
計算機作為一項重要的偉大發(fā)明,如今已經(jīng)廣泛應用到了各行各業(yè),當然也在潛移默化的影響著人們的生活,對于社會的發(fā)展進步也有一定的積極作用。目前計算機也已經(jīng)成為了我們?nèi)粘I钪兄匾囊徊糠,為用戶也提供了相應的便利,下面文章就針對計算機應用現(xiàn)狀和未來發(fā)展趨勢做詳細探討。