當前位置:學問君>學習教育>畢業論文>

基於SOM網絡的城市分類探討及實證分析

學問君 人氣:8.77K

摘要:科學的城市分類不僅便於我們對各個城市的發展進行評估,並且爲我們制定城市的發展決策提供了依據。而基於人工神經網絡(ANN)的自組織特徵映射網絡(SOM)具有強大的聚類功能。文章探討了SOM網絡在城市分類方面的應用,並利用MATLAB軟件,對山東省各地級市城市進行了實證分析,從而指出了SOM網絡在城市分類方面的優缺點及意義。

基於SOM網絡的城市分類探討及實證分析

關鍵詞:人工神經網絡;SOM;城市分類

一、引言

城市分類不僅便於我們對各個城市的發展進行評估,並且爲我們制定城市的發展決策提供了依據。然而,如何能夠進行科學的城市分類一直備受關注。而基於近些年來人工神經網絡的飛速發展,它幫助我們解決了許多棘手的難題,其中的自組織特徵映射網絡(SOM)具有強大的聚類功能,利用它可以幫助我們根據各個城市的特點從而進行科學分類,爲加速我國城市的發展和城鎮化建設有着重要的意義。2005年吳聘奇、黃民生利用SOM網絡對福建省城市進行了職能分類,同年,劉耀彬、宋學鋒又基於SOM人工神經網絡對長江三角洲地區城市職能分類做了研究。從而可見,基於人工神經網絡的自組織特徵映射網絡(SOM)在城市的分類問題確實可以發揮強大的作用。

評價一個城市的各個行業的發展,有許多指標。其中行業就業人口是評價一個城市該行業的發展的基礎指標。本文對山東地區城市的分類實證分析中,對各個城市的各行業就業人口數量進行了採集,其中包括農林牧漁業,採礦業,製造業,電力、煤氣及水的生產和供應業,建築業,交通運輸、倉儲和郵政業,資訊傳輸、計算機服務和軟件業,批發和零售業,房地產業,住宿和餐飲業,金融業,租賃和商務服務業,水利、環境和公共設施管理業,居民服務和其他服務業,教育,科學研究、技術服務和地質勘查業,衛生、社會保障和社會福利業,文化、體育和娛樂業,公共管理和社會組織等19個行業的從業人員數。然後,透過MATLAB軟件進行編程構建,成功地將山東省的17個城市進行了分類,從而說明了SOM網絡在城市分類方面的確有優於其他傳統方法的優點。

二、SOM網絡的基本原理

(一)SOM網絡簡介

自組織特徵映射網絡也稱Kohonen 網絡,或者稱爲Self - Orgnizing Feature Map( SOM) 網絡,它是由芬蘭學者Teuvo Kohonen於1981年提出的。該網絡是一個由全連接的神經元陣列組成的無教師自組織、自學習網絡。Kohonen認爲,處於空間中不同區域的神經元有不同的分工,當一個神經網絡接受外界輸入模式時,將會分成不同的反應區域,各區域對輸入模式具有不同的響應特徵。

SOM網絡的一個典型特徵就是可以在一維或二維的處理單元陣列上,形成輸入信號的特徵拓撲分佈,因此SOM網絡具有抽取輸入信號模式特徵的能力。SOM網絡一般只包含有一維陣列和二維陣列,但也可以推廣到多維處理單元陣列中去。

(二)SOM網絡學習算法

1、初始化。對N個輸入神經元到輸出神經元的連接權值賦予較小的權值。選取輸出神經元j個“鄰接神經元”的集合Sj。其中Sj(0),表示時刻t=0的神經元j的“鄰接神經元”的集合,Sj(t)表示時刻t的“鄰接神經元”的集合。區域Sj(t)隨着時間的增長而不斷縮小。

2、提供新的輸入模式X。

4、給出一個周圍的鄰域Sk(t)。

7、提供新的學習樣本來重複上述學習過程。

三、基於SOM網絡的城市分類實證分析

城市分類可以便於我們瞭解各個城市的發展狀況,從而爲我們制訂城市的發展決策提供依據。現在人工神經網絡已經得到了很大的發展,它爲我們研究此類問題提供了一種新的工具和思路。所以基於這個問題,我們嘗試利用SOM網絡來進行城市分類。SOM網絡是一種具有聚類功能的神經網絡,並且它是無教師訓練方式,我們只需要採集輸入樣本,而不必如入目標值就可以得到我們想要的結果,可見SOM網絡使用也十分方便。

(一)網絡樣本設計

從山東省統計局網站,我們得到了山東省17個地級市城市的樣本。從中我們看出,原始指標數據波動較大,而一般來說,神經元的輸出函數在0-1之間最爲靈敏,爲了提高訓練的效率,所以要把數據進行歸一化處理。歸一化處理方法爲:找出每個指標數據中的最大和最小值,利用(x-min)/(max-min)公式把所有數據歸一化爲0到1之間的數。

(二)網絡設計

本文利用MATLAB R2008進行編程構建。確定網絡的輸入模式爲:

Pk=(P1k,P2k,…pkn) ,k=1,2,…17,n=19

即一共有17組城市樣本向量,每個樣本中包括19個元素。

1、首先利用函數newsom創建一個SOM網絡。根據實際情況本文創建網絡的競爭層分別選用3、4、5、6層的結構。然後經過實驗,分別觀察其性能,從而選取分類效果最好的.一組。

2、利用函數train和仿真函數sim對網絡進行訓練並仿真。仿真的步數大小同樣影響網絡的聚類性能,這裏我們設定步數爲1000。

最後經過分類結果如表1所示。

(三)實驗結果分析

最後經過分析篩選,發現當這17個城市被劃分爲6類時和現實情況較爲符合。分類情況如表2所示。

第一類:從表中看出,濟南和青島被歸爲了一類,並且在分類數爲3、4、5、6時,濟南和青島都被列爲了一類。從表中我們可以看到濟南、青島在各方面都優於其他城市,尤其是製造業、教育、以及公共管理和社會組織方面。濟南是山東省省會,是全省、文化、經濟,金融,教育中心,也是國家批准的沿海開放城市和十五個副省級城市之一。青島是全國70個大中城市之一,全國五個計劃單列市之一。工業有紡織、機車車輛、機械、化學、石油化工、鋼鐵、橡膠、家用電器、啤酒、捲菸等。有馳名中外的青島啤酒、海爾集團、海信集團等大企業集團。並且,二者都有豐富的教育資源,全省大多高校均聚集在此。

第二類:淄博、泰安、德州、聊城在發展方面,各個方面較爲均衡,沒有特別顯著的特點。四者的製造業、建築業和教育大約位於全省中間地位。

第三類:棗莊、東營屬特殊職能類型城市。兩個城市相對其他城市來說,採礦業較爲發達。棗莊境內已探明地下礦藏36種:煤、鐵、銅、鋁、金、銀、鍶(天青石)、石膏、螢石、水泥原料灰巖等。其中煤、石膏地質儲量爲15.4億噸和4.1億噸。而東營又稱“石油之城”,豐富的石油、天然氣資源。但是,兩個城市的製造業相對薄弱,其他產業大約處於平均水平。