時間:2021年03月20日 分類:電子論文 次數(shù):
摘要:針對大范圍內住宅建筑圖斑自動識別較為困難的問題,該文提出基于決策樹模型的分類方法,利用基礎測繪中高精度的建筑數(shù)據、地理省情監(jiān)測數(shù)據、POI數(shù)據、DSM、DEM、騰訊大數(shù)據等,以建筑物本身特征和建筑物不同鄰域內建筑類型相關因素的空間特征作為決策變量,分別采用QUEST、CHAID、C&RT和C5.0算法構建用于住宅分類識別的決策樹模型并進行優(yōu)選。以濟南市(不含原萊蕪市)為研究區(qū)域進行了實驗,結果顯示4個模型均未出現(xiàn)過擬合現(xiàn)象,可以用于住宅建筑圖斑識別。
關鍵詞:住宅建筑;周邊特征;決策樹模型;C5.0;混淆矩陣;接受者操作性能曲線
0引言
近年來,隨著我國社會經濟的不斷發(fā)展,城市化進程進一步快速推進,尤其是城市地區(qū)土地利用類型中建設用地呈現(xiàn)增長趨勢。房屋建筑是人類活動最主要的場所,其數(shù)據信息在城市規(guī)劃[1]、人口估計[2]、應急救援與災害評估[3]等方面的應用中都具有極其重要的意義。
目前對于建筑物的提取研究已有多年,方法也較為成熟,主要方法有以下方面:基于模板匹配的地物提取方法[4]、基于知識的目標提取方法[5]、基于面向對象技術的方法[6]、基于知識和面向對象相結合的方法[7]、基于機器學習的方法[8-9]等。其中,基于機器學習的方法是近些年來研究的重點和熱點,常見的方法有決策樹分類、基于規(guī)則分類、神經網絡、支持向量機(supportvectormachine,SVM)和樸素貝葉斯分類等[10]。以上研究均為基于遙感數(shù)據的建筑物識別,主要目的是為了提取出建筑物數(shù)據,而對于建筑物更進一步的詳細類型則沒有進行劃分。
而建筑物中的住宅與人類生活息息相關,其分布和位置以及周邊設施等直接影響居民的生活質量,如果能獲取精細住宅建筑數(shù)據,那么對于居民生活環(huán)境分析、基礎設施均衡化評價、常住人口分布、政府規(guī)劃決策等方面提供精準有效的輔助支撐。目前,對于住宅建筑的識別也有一些研究,文獻[2]基于建筑物三維空間分布數(shù)據,運用面向對象分類方法剔除非住宅建筑物,得到住宅建筑分布數(shù)據;文獻[11]中通過對遙感影像進行目視解譯,通過矢量化方法提取居住建筑圖斑。這些方法都停留在結合地圖和實地調查或者影像的目視解譯層面,提取數(shù)據效率低,人工工作量大,不適于大范圍區(qū)域。近些年,我國的基礎測繪建設逐漸完善,成果資源豐碩,對于海量數(shù)據的深度挖掘與應用也是近些年測繪行業(yè)關注和探索的重點。
本次研究以山東省濟南市(不包含原萊蕪市)范圍內基礎測繪中高精度的建筑基底圖斑數(shù)據為基礎,結合地理省情監(jiān)測數(shù)據、興趣點(pointofinformation,POI)數(shù)據、數(shù)字地表模型(digitalsurfacemodel,DSM)、數(shù)字高程模型(digitalelevationmodel,DEM)、騰訊大數(shù)據等,按照城市和農村不同區(qū)域,實現(xiàn)住宅建筑識別,探討和研究濟南市住宅建筑圖斑高效提取方法及其分布形態(tài)。由于具有可讀性、分類速度快、能夠生成分類規(guī)則集等優(yōu)點,因此本研究選擇決策樹算法進行建模。
1研究區(qū)域
濟南市位于山東省中部,是山東省省會城市,地理位置介于36°01′~37°32′N,116°11′~117°44′E,面積7998km2;南部為泰山山地,北部為黃河平原,背山面水,地勢南高北低,地形復雜多樣[12]。
2018年年底濟南市常住人口746.04萬人,戶籍人口655.90萬人,全市地區(qū)生產總值7856.56億元[13]。濟南市地表覆蓋類型以種植業(yè)為主,其次為林草覆蓋和房屋建筑(區(qū)),房屋建筑(區(qū))主要集中在濟南市中部低海拔平原地區(qū)。2019年1月,原萊蕪市所轄區(qū)域劃歸濟南市,由于本次研究數(shù)據現(xiàn)勢性主要為2018年,所以研究區(qū)域為未進行行政區(qū)劃調整前的濟南市范圍。
2數(shù)據來源
2.1基礎測繪數(shù)據
基礎測繪數(shù)據是測繪行業(yè)最全面、基礎的數(shù)據成果,特別是及時更新矢量數(shù)據,已經實現(xiàn)每年甚至更短時間的更新頻率,具有較強的現(xiàn)勢性。本文采用基礎測繪及時更新數(shù)據中的建筑基底面狀數(shù)據作為基礎數(shù)據;此外,POI數(shù)據是最重要的輔助數(shù)據。數(shù)據現(xiàn)勢性為2018年。
2.2地理省情監(jiān)測數(shù)據采用房屋建筑(區(qū))和城鎮(zhèn)綜合功能單元、城市空間格局數(shù)據。數(shù)據現(xiàn)勢性為2018年6月30日。
2.3激光點云數(shù)據和DEM數(shù)據利用激光點云數(shù)據中的DSM數(shù)據,結合DEM數(shù)據,可以獲取建筑物高度信息。DSM和DEM現(xiàn)勢性分別為2014年、2015年。
2.4騰訊位置大數(shù)據社交位置數(shù)據與人類活動有很強的相關性,獲取騰訊大數(shù)據平臺上濟南市范圍內社交位置數(shù)據,按照白天和晚上不同時段進行獲取,即從一定程度上可以反映人為活動及聚集密度。數(shù)據現(xiàn)勢性為2018年7月。
3研究方法
濟南市建筑物圖斑約1.6×106個,涵蓋住宅、工商企業(yè)、機關單位、公共設施等類別的建筑物,還包括一些附屬建筑和臨時性建筑。本次研究目的主要為從海量建筑基底圖斑中識別出住宅建筑圖斑數(shù)據,因此對于非住宅類的建筑數(shù)據不再進行詳細劃分。而由于不同區(qū)域住宅建筑在形狀、高度、聚集情況等有所差異,需要按照區(qū)域及住宅不同的類型建立多層次的分類系統(tǒng)。
3.1特征變量選擇
用于住宅識別的變量首先應當包括建筑物自身的屬性特征,包括幾何屬性和通過其他數(shù)據獲取的屬性。此外,地理學第一定律和地理學第二定律分別說明了事物的空間相關性和空間異質性,本文引入了大量的周邊空間特征變量,根據住宅建筑自身及周邊位置事物之間的關系特征進行識別。
3.1.1建筑物圖斑特征
建筑物圖斑特征即建筑物圖斑自身特征,包括建筑自身的幾何特征和由其他數(shù)據確定的屬性特征。幾何特征變量主要有:層數(shù)、面積、周長、節(jié)點數(shù)、朝向(與正北方向夾角)、長寬、形狀因子等。
3.2決策樹分類算法模型選取
決策樹模型是通過訓練形成一組決策規(guī)則并且可以對未知對象進行預測或分類的樹狀系統(tǒng),它主要包括兩個階段:分裂和剪枝。決策樹的構建過程是一種從上向下、遞歸分治的過程,先根據特征變量選擇最有效的樣本集劃分方式,形成新的決策分支;后對分支進行修剪來優(yōu)化決策樹。常見的決策樹分類算法有以下方面。
1)卡法自動交互檢測算法(chi-squaredautomaticintera-ctiondetector,CHAID)。CHAID[14]算法是一種使用卡方統(tǒng)計選擇特征變量(卡方值最顯著特征),從而建立決策樹的分類方法,其特征變量選擇和分支點選擇同時進行。剪枝策略為預剪枝。2)快速無偏有效的統(tǒng)計樹(quickunbiasedefficientstat-isticaltree,QUEST)。QUEST[15]算法是對CHIAD的改進,該算法將特征變量選擇和分支點選擇分開進行。如果特征變量為分類變量,則采用卡方檢驗;如果特征變量為有序或連續(xù)變量,則使用F檢驗;選擇P值最小且小于顯著水平α的特征變量作為當前最佳分支變量。剪枝策略為后剪枝。
4結果與分析
4.1決策樹分類模型精度評價
采用決策樹分類模型,對城區(qū)、農村分區(qū)域進行建模,訓練集、驗證集的混淆矩陣正確率。可以看出,4個決策樹分類模型中,C5.0模型的精度最高。訓練集、測試集精度分別為城區(qū)96.6%、94.81%,農村97.73%、95.14%。農村地區(qū)模型略優(yōu)于城區(qū)。其他3類模型精度差異不大,均未超過90%,遠低于C5.0模型。所以C5.0模型更適用于建筑物識別分類。
5結束語
本文利用測繪行業(yè)多源、多尺度數(shù)據,基于多種決策樹模型,實現(xiàn)濟南市城市和農村不同區(qū)域建筑物圖斑分類識別,并且對模型結果做精度比對評價,實現(xiàn)了對測繪大數(shù)據的有效挖掘,同時也拓寬了現(xiàn)有地理信息數(shù)據的維度,對地理省情監(jiān)測統(tǒng)計分析等應用工作進行了有效的探索。
計算機論文范例:計算機應用技術與信息管理的整合
主要結論如下:本文用于建筑物圖斑識別的變量除了建筑物自身屬性特征外,結合地理學第一定律,引入了周邊不同緩沖空間范圍內其他影響因地區(qū)和農村地區(qū)分類特征變量重要性進行分析,城市地區(qū)建筑物圖斑識別特征變量重要性前6位依次為:層高、地表覆蓋類型、節(jié)點數(shù)、周邊100m內建筑物數(shù)量、周邊50m建筑物數(shù)量、寬等;而農村地區(qū)依次為周邊50mPOI數(shù)、地表覆蓋類型、距離辦公商業(yè)最近距離、距離交通運輸點距離、面積、周邊50m道路總段數(shù)等。
可以看出:城市和農村用于識別的特征變量有較大差別,城市地區(qū)特征變量貢獻比較大的為建筑物自身特征,說明城市住宅和非住宅建筑物細節(jié)特征差異比較明顯;而農村地區(qū)建筑自身細節(jié)差別較小,需要依據周邊特征幫助區(qū)分。
參考文獻
[1]李垚,趙衛(wèi)東,衛(wèi)剛.城市規(guī)劃建筑圖紙電子報批系統(tǒng)實施與關鍵技術[J].計算機應用,2007,27(S2):242-243.(LIYao,ZHAOWeidong,WEIGang.Implementationandkeytechnologyofelectronicapprovalsystemforurbanplanningandbuildingdrawings[J].JournalofComputerApplications,2007,27(S2):242-243.)
[2]卓莉,黃信銳,陶海燕,等.基于多智能體模型與建筑物信息的高空間分辨率人口分布模擬[J].地理研究,2014,33(3):520-531.(ZHUOLi,HUANGXinrui,TAOHaiyan,etal.Highspatialresolutionpopulationdistributionsimulationbasedonbuildinginformationandmulti-agent[J].GeographicalResearch,2014,33(3):520-531.)
[3]眭海剛,劉超賢,黃立洪,等.遙感技術在震后建筑物損毀檢測中的應用[J].武漢大學學報(信息科學版),2019,44(7):1008-1019.(SUIHaigang,LIUChaoxian,HUANGLihong,etal.Applicationofremotesensingtechnologyinearthquake-inducedbuildingdamagedetection[J].GeomaticsandInformationScienceofWuhanUniversity,2019,44(7):1008-1019.)
作者:牛宵