矩陣論在神經網絡中的應用范文
時間:2024-03-28 18:10:06
導語:如何才能寫好一篇矩陣論在神經網絡中的應用,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

篇1
人工神經網絡是近年來迅猛發展的前沿課題,它對突破現有科學技術的瓶頸起到重大的作用。本文剖析了人工神經網絡的特征、模型結構以及未來的發展趨勢。
【關鍵詞】人工神經網絡 神經元 矩陣
1 人工神經網絡概述
人工神經網絡(ANN)是一種用計算機網絡系統模擬生物神經網絡的智能神經系統,它是在現代神經生物學研究成果的基礎上發展起來的,模擬人腦信息處理機制的一種網絡系統,它不但具有處理數值數據的計算能力,而且還具有處理知識的學習、聯想和記憶能力。
人工神經網絡模擬了大腦神經元的組織方式,反映了人腦的一些基本功能,為研究人工智能開辟了新的途徑。它具有以下基本特征:
1.1 并行分布性
因為人工神經網絡中的神經元排列并不是雜亂無章的,往往是以一種有規律的序列排列,這種結構非常適合并行計算。同時如果將每一個神經元看作是一個基本的處理單元,則整個系統可以是一個分布式處理系統,使得計算快速。
1.2 可學習性和自適應性
一個相對很小的人工神經網絡可存儲大量的專家知識,并能根據學習算法,或利用指導系統模擬現實環境(稱為有教師學習),或對輸入進行自適應學習(稱為無教師學習),可以處理不確定或不知道的事情,不斷主動學習,不斷完善知識的存儲。
(3)魯棒性和容錯性
由于采用大量的神經元及其相互連接,具有聯想映射與聯想記憶能力,容錯性保證網絡將不完整的、畸變的輸入樣本恢復成完整的原型,魯棒性使得網絡中的神經元或突觸遭到破壞時網絡仍然具有學習和記憶能力,不會對整體系統帶來嚴重的影響。
1.3 泛化能力
人工神經網絡是大規模的非線性系統,提供了系統協同和自組織的潛力,它能充分逼近任意復雜的非線性關系。如果輸入發生較小變化,則輸出能夠保持相當小的差距。
1.4 信息綜合能力
任何知識規則都可以通過對范例的學習存儲于同一個神經網絡的各連接權值中,能同時處理定量和定性的信息,適用于處理復雜非線性和不確定對象。
2 人工神經網絡模型
神經網絡是在對人腦思維方式研究的基礎上,將其抽象模擬反映人腦基本功能的一種并行處理連接網絡。神經元是神經網絡的基本處理單元。
在神經網絡的發展過程中,從不同角度對神經網絡進行了不同層次的描述和模擬,提出了各種各樣的神經網絡模型,其中最具有代表性的神經網絡模型有:感知器、線性神經網絡、BP網絡、自組織網絡、徑向基函數網絡、反饋神經網絡等等。
3 神經元矩陣
神經元矩陣是神經網絡模型的一種新構想,是專門為神經網絡打造的一個矩陣,它符合神經元的一切特征。
神經元矩陣采用矩陣形式,它可為n維向量組成。引入向量觸頭和信使粒的概念,向量觸頭可生長,即長度可變,方向可變,信使粒可“游蕩”在矩陣中,建立各種聯系。如圖1即是神經元矩陣模型
(1)容器可產生一種無形的約束力,使系統得以形成,容器不是全封閉的,從而保證系統與外界的溝通和交互;各向量間可用相互作用的力來聯系,而各個信使粒則受控于容器、中空向量以及其它的信使粒。各神經元之間自主交互,神經元矩陣是一種多層次的管理,即一層管理一層。系統具有明顯的層級制和分塊制,每層每塊均獨立且協同工作,即每層每塊均含組織和自組織因素。
(2)向量觸頭是中空的,信使粒可以通過向量或存儲于向量中,所以又稱為中空向量。向量存儲了信使粒后,可以吸引更多的信使粒在附近,或使鄰近向量轉向、伸長,進而形成相對穩定的信息通路。
(3)當兩條或更多的信息通路匯集時,可能伴隨著通路的增強、合并,以及信使粒的聚集、交換,這是神經元矩陣運算的一種主要形式。通路的形成過程,也就是是神經元矩陣分塊、分層、形成聯接的過程,也為矩陣系統宏觀管理、層級控制的實現奠定了基礎。
神經元矩陣亦是一種具有生物網絡特征的數學模型,綜合了數學上矩陣和向量等重要概念,是一種立體的矩陣結構。尤其是將矩陣的分塊特性和向量的指向特征結合起來,更好的體現了神經網絡的整體性和單元獨立性,系統的組織和自組織特征也更為凸顯。信使粒以“點”的數學概念,增強了系統的信息特征,尤其是增強了矩陣的存儲和運算功能。
4 人工神經網絡的發展趨勢
人工神經網絡是邊緣叉科學,它涉及計算機、人工智能、自動化、生理學等多個學科領域,研究它的發展具有非常重要意義。針對神經網絡的社會需求以及存在的問題,今后神經網絡的研究趨勢主要側重以下幾個方面。
4.1 增強對智能和機器關系問題的認識
人腦是一個結構異常復雜的信息系統,我們所知道的唯一智能系統,隨著信息論、控制論、計算機科學、生命科學的發展,人們越來越驚異于大腦的奇妙。對人腦智能化實現的研究,是神經網絡研究今后的需要增強的地發展方向。
4.2 發展神經計算和進化計算的理論及應用
利用神經科學理論的研究成果,用數理方法探索智能水平更高的人工神經網絡模型,深入研究網絡的算法和性能,使離散符號計算、神經計算和進化計算相互促進,開發新的網絡數理理論。
4.3 擴大神經元芯片和神經網絡結構的作用
神經網絡結構體現了結構和算法的統一,是硬件和軟件的混合體,神經元矩陣即是如此。人工神經網絡既可以用傳統計算機來模擬,也可以用集成電路芯片組成神經計算機,甚至還可以生物芯片方式實現,因此研制電子神經網絡計算機潛力巨大。如何讓傳統的計算機、人工智能技術和神經網絡計算機相融合也是前沿課題,具有十分誘人的前景。
4.4 促進信息科學和生命科學的相互融合
信息科學與生命科學的相互交叉、相互促進、相互滲透是現代科學的一個顯著特點。神經網絡與各種智能處理方法有機結合具有很大的發展前景,如與專家系統、模糊邏輯、遺傳算法、小波分析等相結合,取長補短,可以獲得更好的應用效果。
參考文獻
[1]鐘珞.饒文碧.鄒承明著.人工神經網絡及其融合應用技術.科學出版社.
篇2
與經典測驗理論相比,項目反應理論(簡稱IRT)由于具有參數不變性、能進行計算機化自適應測驗等優點而受到歡迎[1,2],但是也存在著不少問題,首先是目前比較成熟的、得到廣泛應用的IRT軟件,如BILOG、MicroCAT等,主要是運用極大似然法或貝葉斯方法進行項目參數和被試能力估計[3],一般都只能處理二值記分的項目,也有少數軟件可以處理等級記分的項目,例如MULTILOG,但對于連續記分的項目還缺少估計方法和工具;其次是在運用BILOG、MicroCAT和MULTILOG等軟件時往往需要數百人的大樣本,而對于小樣本則缺少有效的估計方法,因此需要另尋途徑來解決這些問題。
2 聯結主義理論中的級連相關模型
聯結主義理論(或稱人工神經網絡)是近年來得到廣泛關注的認知心理學理論[4,5,6],它一方面可以用來模擬人的認知活動,探討人類的信息加工機制[7],另一方面可以作為一種工具來分析系統的輸入和輸出之間的關系,特別是當系統的輸入和輸出之間難以用顯性的數學方程表示時,聯結主義模型就可以通過其本身的學習功能,在用一組已知的輸入和輸出數據對它進行訓練以后,就可以在一定程度上掌握了該系統內部的輸入和輸出之間的關系,即建立了某種模型。如果我們再給這個經過訓練的網絡模型以新的輸入,那么它就可以給出相應的輸出值。因此,人們可以利用聯結主義模型的這種性質來進行預測和參數估計等活動[8]。
聯結主義模型通常由一個輸入層、一個輸出層和若干個隱含層組成,每一層中含有若干個結點,一個模型中所含的隱含層數目和各層所含結點數目,是由具體問題的性質和復雜程度來確定的。各個結點之間的聯結具有一定的權重,它的大小反映了相鄰兩個結點之間相互影響的程度,在模型被訓練的過程中,各結點間的權重得到了調整。
聯結主義模型通常可以分為靜態型和動態型兩種,靜態型模型的拓撲結構是實驗者在一開始的時候就設計好的,它的訓練過程就是調節各結點之間的權重。動態型模型的拓撲結構是在訓練過程中不斷變化的,它能夠隨著訓練的進行,自動地加入新的隱含結點,同時也調整各結點間的聯結權重,這樣就可以更快地減少訓練誤差。
級連相關模型是動態型聯結主義模型中的一種[9],它的計算精度較高,運算速度較快。在開始訓練時,該模型只有輸入層和輸出層,處于最小拓撲結構。隨著訓練過程的進行,它能夠根據需要自動地逐個加入隱含結點。該模型的訓練分為輸出和輸入兩個階段交替進行,首先是輸出階段,在這一階段,模型對聯結隱含結點和輸出結點間的各權重進行調整,直到誤差不再減少為止;然后轉至輸入階段,在這一階段,模型對于聯結輸入結點和候選隱含結點間的各個權重進行調整,并從中選出其輸出變量和網絡的誤差變量間相關為最大的候選隱含結點,把它裝入網絡,這樣使得每次裝入的新隱含結點都能最大程度地影響誤差的變化。然后再轉至輸出階段,這個過程不斷重復,直到達到預定的訓練精度。在本研究中,由于無法事先確定模型的拓撲結構,以及為了較快地對模型進行訓練和達到較好的訓練和測試效果,采用了級連相關模型作為研究的工具。
3 連續記分IRT模型
連續記分IRT模型是二值記分IRT模型的擴展,即它的記分不是按照二值邏輯的全對或全錯的方式來進行,而是根據被試答對項目的程度來進行記分,如果全對該題目就得滿分。由于各題目的滿分值不一樣,有的是3分、5分、6分或更高的分數,為了統一起見,可以對它們進行歸一化處理,全部轉化為0至1的值。這樣就可以和下面的三參數邏輯斯諦模型中的P(θ)相一致。Samejima[10]、Muller[11]和Mullenbergh[12]等都對連續記分IRT模型進行過研究,它和二值記分模型一樣,可以用正態卵形模型和邏輯斯諦模型表示。對于常用的三參數邏輯斯諦模型,它的表示式為:
P(θ)=c[,i]+(1-c[,i])exp[1.7a[,i](θ-b[,i])]/{1+exp[1.7a[,i](θ-bi)]}
在該模型中,式中的ai、bi和ci分別為第i個項目的區分度、難度和猜測參數,θ為某個被試的能力,P(θ)為該被試答對第i個項目的概率,它的值為0至1,這是一個連續的值。
雖然有些學者對于該模型進行了一些研究,但是他們的研究還只是涉及該模型的性質、信息函數的定義、參數不變性等方面,在具有實用意義的參數和被試能力估計方面還沒有成熟的結果。
為了對連續記分IRT模型的參數估計問題進行研究,作者對目前常用的幾個IRT軟件的算法進行分析[13,14],發現它們的共同特點都是運用統計的方法來進行參數估計,都無法對小樣本情況下的IRT連續記分模型進行參數估計,于是作者就決定另辟捷徑,在本研究中采用了和常用統計技術完全不同的聯結主義模型(人工神經網絡)方法。運用統計方法不能完全解決的問題,并不意味著用其它方法就不能解決,其關鍵問題是常用的統計參數估計方法大多是建立在線性模型的基礎上的,而被試的反應和IRT中參數之間的關系是非線性的,因此在運用統計方法進行參數估計時,要采用大樣本才能得到較好的結果。而人工神經網絡的輸出和輸入之間的關系本身就是非線性的,特別值得一提的是,本研究把人工神經網絡的激活函數設計為S型的Sigmoid函數,它的表達式為
f(x)=exp(x)/[1+exp(x)]
它和上述的三參數邏輯斯諦模型的表示式非常相似,仔細比較一下,就可以看出它實際上就是IRT模型在c[,i]=0,b[,i]=0,1.7a[,i]=1,θ=x時的特例,因此聯結主義模型(人工神經網絡)的這種輸出和輸入之間的非線性結構就可以較好地處理IRT中相類似的數據關系。
4 計算機模擬實驗的設計和實施
該實驗的基本思想是:把一組被試對于一組項目的反應矩陣作為級連相關模型(以下簡稱為神經網絡)的輸入,這組被試的能力θ或該組項目的參數a、b和c作為該模型的輸出,并且用這些輸入和對應的輸出值對該神經網絡進行訓練,經過訓練的網絡就具備了估計θ,a,b或c的能力。當輸入一組新的反應矩陣時,該網絡就可以輸出所需的被試能力或項目參數估計值。本實驗是用計算機模擬方法來考察運用這種方法得到的估計值和真實值之間的誤差是否能夠達到相當小的程度。
4.1 實驗步驟的設計
整個實驗分以下幾個步驟進行:
(1)運用蒙特卡羅方法產生一組均勻分布的被試能力值θ,一組均勻分布的項目參數值(包括項目區分度a、項目難度b和項目猜測參數c)。被試能力值θ的分布范圍為[-3,+3],項目區分度a的分布范圍為[0,2],項目難度b的分布范圍為[-3,+3],項目猜測參數c的分布范圍為[0,0.25]。
(2)根據項目反應模型,讓各個模擬的被試回答各個模擬的項目,產生反應矩陣。
(3)將該反應矩陣作為神經網絡訓練模式的輸入部分,用所要學習的項目參數或被試能力作為訓練模式的輸出部分。若要估計被試的能力,就把反應矩陣中的每一行作為一個模式,因為它恰好是一個被試對于一組項目的反應;若要估計項目參數,就把反應矩陣中的每一列作為一個模式,因為它反映了每一個項目被解答的情況。
(4)用上述訓練模式對一組神經網絡進行訓練,直至達到預定的精確度為止。在本研究中為了統計上的方便,對30個神經網絡進行了訓練,預定的精確度為網絡的目標值和實際輸出值之間的誤差小于0.001。
(5)用經過訓練的神經網絡來估計被試能力和項目參數。在本研究中需要估計的被試能力和項目參數的真實值實際上是用蒙特卡羅方法產生的,因此可以計算出估計值(實際輸出值)和真實值的誤差,稱為測試誤差,并用下式表示:
附圖
式中,T[,p.o]為每個測試模式的每個輸出結點的目標值。N[,p.o]為每個測試模式的每個輸出結點的實際輸出值。p是測試模式的數目,o是輸出結點的數目。根據測試誤差E的大小,可以看出經過訓練的神經網絡是否真正可以對項目參數和被試能力進行很好的估計。
4.2 預備實驗
由于在正式對神經網絡進行訓練以前,對于要用什么樣的模式來訓練沒有任何先驗的知識,為此先進行預備實驗。和正式實驗的步驟一樣,首先運用蒙特卡羅方法產生25個被試對15個項目的反應矩陣,用這一矩陣和相應的被試能力或項目參數組成4組訓練模式,分別用以估計θ,a,b和c。在對被試能力進行估計時,將矩陣的行作為一組神經網絡訓練模式的輸入部分,因為矩陣的一行數據就代表了一個被試對所有項目的反應;相應被試的θ值作為訓練模式的輸出部分,因為它代表了被試的能力值。在對項目參數進行估計時,將矩陣的列作為一組神經網絡訓練模式的輸入部分,因為矩陣的一列數據就代表了所有被試對一個項目的反應;相應項目的a,b或c值作為訓練模式的輸出部分,因為它代表了項目的參數值。就用這些訓練模式分別對4組神經網絡進行訓練,這4組神經網絡分別對應于被試能力和項目的三個參數,每組有30個網絡。然后,再用蒙特卡羅方法產生另外25個被試對另外15個項目的反應矩陣,并用已經訓練過的網絡對這個反應矩陣估計θ,a,b和c,記錄下測試誤差。其結果表明,雖然可以進行被試能力和項目參數的估計,但誤差較大,無法達到實際應用的精確度。根據神經網絡訓練的一般規律,估計出現這一情況的原因有兩條,一是訓練模式太少,二是訓練模式和測試模式之間沒有任何聯系,即沒有用“錨題”或“錨人”把它們聯系起來,改進的方法可以是增加訓練模式,或運用一定的“錨題”或“錨人”方法,在本研究中先用“錨題”的方法進行試驗(具體方法在進行正式實驗時詳述),試驗的效果很好,然后進行下面的正式實驗。
4.3 正式實驗
(1)步驟1:產生訓練矩陣和測試矩陣
運用蒙特卡羅方法產生25個被試(稱為第一組被試)對45個項目(稱為第一組項目)的反應矩陣(稱為第一矩陣),這一矩陣在下面的實驗中將作為測試矩陣;從該45個項目中隨機取出15個項目(稱為第二組項目),再用蒙特卡羅方法產生另外25個被試(稱為第二組被試),令它們和上述隨機取出的第二組項目起反應,產生另一個反應矩陣(稱為第二矩陣),用它作為訓練模式的一部分,由此可見,訓練矩陣和測試矩陣之間有15個項目作為“錨題”,如下面圖1所示。
附圖
圖1 被試、項目和反應矩陣
圖1中的第三組項目和第三矩陣將在下面作解釋。
(2)步驟2:建立能力訓練模式
用“第二矩陣”中的每一行作為一個模式的輸入,其相應的25個第二組被試的能力值作為輸出,組成能力訓練模式,對一組神經網絡(共30個,稱為第一組神經網絡)進行訓練。
(3)步驟3:建立能力測試模式并進行測試
將“第一矩陣”中的每一行作為一個模式的輸入,相應的第一組被試的25個能力值作為輸出,組成能力測試模式,用上述經過訓練的第一組神經網絡對其進行測試。這時,實際上是神經網絡對第一組被試的能力值進行估計。然后,將估計值和真實值進行比較,記錄下測試誤差,如表1左邊第1列所示,要注意的是,表中記錄的是30個網絡的測試誤差實際值,根據公式可見,它是所有輸出結點和所有測試模式的誤差總和。由于本研究中只有一個輸出結點,有25個測試模式(因為有25個被試),因此要將表中的測驗誤差實際值除以25,得到對單個測試模式的測試誤差,然后,再計算其平均數M和標準差SD,結果如表2所示,可以看出測試誤差是比較小的。由此可見,當測試模式中有部分項目(本例中為15個項目)和訓練模式相同時,經過訓練的神經網絡可以對被試的θ進行很好的估計。應該指出的是,測試模式和訓練模式中沒有被試是重復相同的,這說明經過訓練的神經網絡確實可以對新的被試進行能力估計。
表1 測試誤差
θ
a
b
c
0.129
2.239
2.982
0.065
0.084
1.843
2.976
0.056
0.243
2.016
2.798
0.069
0.324
1.804
2.133
0.058
0.126
2.159
2.556
0.027
0.201
2.224
2.399
0.067
0.288
2.246
2.617
0.043
0.114
1.741
2.834
0.065
0.189
1.937
2.347
0.076
0.249
2.295
2.745
0.092
0.264
2.319
2.433
0.065
0.321
2.382
2.030
0.044
0.105
2.136
2.231
0.093
0.132
2.061
2.244
0.023
0.153
2.019
2.868
0.068
0.279
2.270
2.042
0.044
0.204
2.196
1.850
0.099
0.102
1.950
2.597
0.059
0.105
1.732
1.709
0.089
0.282
1.764
2.328
0.072
0.228
2.281
2.556
0.114
0.256
2.089
1.961
0.071
0.222
2.445
2.002
0.093
0.210
1.666
2.243
0.035
0.138
1.743
2.441
0.075
0.201
2.438
2.034
0.080
0.171
1.740
2.100
0.106
0.246
2.307
2.594
0.069
0.195
1.577
2.535
0.057
0.213
2.436
2.199
0.057
(4)步驟4:建立項目參數訓練模式
當估計項目參數時,將“第一矩陣”中的每一列作為一個模式的輸入,因為每一列都代表所有被試對一個項目的反應情況,于是可以將與各列相應項目的a、b或c作為輸出,組成項目參數訓練模式,用該模式對一組神經網絡(共30個,稱為第二組神經網絡)進行訓練。
(5)步驟5:建立項目參數測試模式并進行測試
用蒙特卡羅方法產生15個項目(稱為第三組項目)的參數a、b、c,并用原先已經產生的第一組被試的θ值對它們起反應,產生反應矩陣(稱為“第三矩陣”)。然后,將“第三矩陣”中的每一列作為模式的輸入,相應的15個項目的參數a、b或c作為輸出,組成測試模式。用經過訓練的第二組神經網絡對其進行測試,也就是由神經網絡對第三組項目進行參數估計,然后將估計值和真實值進行比較,記錄下測試誤差,如表1的2、3、4列所示。和對θ估計的測試誤差一樣,它是所有測試模式的誤差之和。這里共有15個測試模式(即上述的第三組項目)。因此要把表1中的的2、3、4列數字除以15,再求平均數M和標準差SD,得到結果在表2中。
表2 單個模式測試誤差的平均數和標準差
統計項
θ
a
b
c
M
0.0027
0.1379
0.1586
0.0045
SD
0.0009
0.0174
0.0227
0.0015
4.4 減少項目參數的測試誤差的實驗
從表2的數據可以看出,上述方法對于θ的估計已經達到了較好的精度,但對于a、b和c的估計誤差仍然比較大。于是再用增加訓練模式的方法來試圖減少測試誤差。上述在訓練第二組神經網絡時,是用“第一矩陣”中的每一列作為模式的輸入,該矩陣共有45列,相應于第一組的45個項目。現在將這組項目擴大,即增加到60個,75個,90個和105個,這些項目的參數都是用蒙特卡羅方法產生的。然后,拿第一組25個被試的θ值和它們起反應,用產生的反應矩陣和相應的項目參數作為訓練模式,對30個神經網絡進行訓練,并重復上述步驟4和步驟5,得到在各種不同數量的訓練模式條件下的a、b和c的單個模式測試誤差的平均數M和標準差SD,如表3所示。從表中數據可以看出,隨著訓練項目數的增加,對項目參數a、b和c的測試誤差都有明顯降低,當項目數達到105時,基本上已經可以接受參數估計的結果了。
附圖
從上面的討論可以看出,在該計算機模擬實驗中,共有兩組被試,第一組被試是用于能力測試模式的,第二組被試是用于能力訓練模式的;該實驗中有三組項目,其中的第二組項目是第一組的一部分,第一組項目用于項目參數訓練和能力測試模式的,第三組項目是用于項目參數測試模式的,第二組項目是用于能力訓練模式的;該實驗中有三個反應矩陣,其中的第一矩陣又被分為左、右兩個部分,左部分是由被抽取出來的第二組項目產生的,右部分是由其余項目產生的,第二矩陣的“行”作為能力訓練模式,第一矩陣的“行”作為能力測試模式,第一矩陣的“列”作為項目參數訓練模式,第三矩陣的“列”作為項目參數測試模式。
4.5 實際測驗中的被試能力和項目參數估計步驟小結
上述的實驗是在計算機模擬的情況下了產生的各組被試能力和項目參數,在實際的測驗情況中,可以按照以下步驟來進行測驗編制以及被試能力和項目參數估計:
(1)在已知項目參數的題庫中取出若干個項目(類似于上述模擬實驗中的第二組項目,這些項目可以是二值記分的,它可以事先通過BILOG等估計得到),再加上自行編制的、未知參數的若干項目(類似于上述模擬實驗中第三組項目),混合后組成實際的測驗試卷。
(2)用這一試卷對一組真實的被試(類似于上述模擬實驗中的第一組被試)進行測試,得到一組實際的結果。
(3)用蒙特卡羅方法產生一組被試的能力值(類似于上述模擬實驗中的第二組被試),令它和真實試卷中的已知項目參數的那部分項目(類似于上述模擬實驗中的第二組項目)起反應,得到反應矩陣(類似于上述模擬實驗中的第二矩陣)。
(4)用這一矩陣和這組蒙特卡羅方法產生的被試能力值組成能力訓練模式,對一組神經網絡進行訓練。
(5)用真實的測驗結果矩陣的每一行作為一個模式的輸入部分,輸入上述經過訓練的神經網絡,其輸出就是真實被試的能力估計值。
(6)運用蒙特卡羅方法產生一組項目參數,根據上述的模擬實驗,大約要有100個項目的參數,令真實被試的能力估計值和它們起反應,得到一個反應矩陣(類似于上述模擬實驗中的第一矩陣右部分)。用這個矩陣中的每一列和相應的蒙特卡羅方法產生的項目參數組成訓練模式,對另一組神經網絡進行訓練,使之具有估計項目參數的功能。
(7)將這一經過訓練的神經網絡對真實測驗中未知參數的那部分項目(類似于上述模擬實驗中的第三組項目)進行參數估計,從而得到這些項目的參數估計值。
至此,就把實際的被試能力和項目參數估計出來了。對照上述模擬實驗的圖1,其中的第一矩陣左部分和第三矩陣是由真實測驗的數據產生的,第一矩陣的右部分和第二矩陣是用蒙特卡羅方法產生的。
5 討論
5.1 該方法的優點
(1)提出了一種全新的IRT項目參數和被試能力的估計方法,以往的方法都是建立在統計基礎上的,而該方法則是建立在聯結主義理論(人工神經網絡)基礎上的。
(2)以往的方法多數只能對二值記分的IRT模型進行參數估計,本研究中的方法則可以對連續記分的IRT模型進行參數估計。由于人工神經網絡有很強的學習功能,因此從理論上講,它也可以用于等級記分和二值記分的IRT模型,當然,這有待于進一步的實驗研究。
(3)本研究中用于估計被試能力的樣本只有25人,用于估計項目參數的樣本只有15個項目,都屬于比較小的樣本,這說明該方法可以用于小樣本的情況,這是以往方法所不能解決的。雖然在對神經網絡訓練時可能要用到較多的訓練模式,但這些模式是可以用蒙特卡羅方法產生的,并不要擴大實際的測驗樣本。
(4)在使用一般的統計方法處理小樣本的數據時,確實存在著參數估計的可靠性問題,但是本實驗的研究表明,在運用與統計方法完全不同的聯結主義(人工神經網絡)方法處理數據時,就有可能克服這一困難。這是什么原因呢?在對人工神經網絡理論進行深入探討以后[15~17],可以發現神經網絡在對IRT參數進行估計時,并不是一開始就直接根據原始數據來估計參數,而是先對一組神經網絡進行訓練,使它們首先具備了這方面的知識,然后再用訓練過的神經網絡對IRT參數進行估計,這種參數估計的可靠性如何,并不取決于被估計的樣本的大小,而是取決于對這些神經網絡進行訓練的樣本的數量、質量以及神經網絡的拓撲結構和算法。在這其中,訓練模式是研究者運用蒙特卡羅方法產生的,它本身并不是一個小樣本,而是一個比較大的樣本;產生這些數據的模型就是IRT模型本身,因此數據本身的質量是有保證的。關于神經網絡的拓撲結構,在大多數情況下是要通過預測和調整學習率等參數來確定隱含層的數量和其中每一層的神經元的數量,但由于本研究采用的是級聯相關模型,它可以根據反傳誤差的大小自動地調整網絡的拓撲結構和聯結權重,因此可以自動地建立優化的網絡結構,不再需要考慮學習率等問題;另外在人工神經網絡的訓練過程中,本研究的程序設計也使得只有誤差達到預定的很小的數值時,訓練過程才停止,這就保證了被訓練過的神經網絡是較高質量的。由此可見,聯結主義(人工神經網絡)模型是采用了和一般統計技術完全不同的思路和方法,它對IRT參數估計的可靠性主要不是取決于被估計樣本的大小,而是依賴于經過訓練的神經網絡的質量,因此我們只要采取一定的措施將神經網絡訓練好,就有可能對小樣本的IRT數據進行可靠的參數估計。
5.2 需要進一步研究的問題
(1)首先是在編制測驗時,需要一部分已知項目參數的二值記分題目,這對于已經建立題庫的學科來說是可以做到的,但對于尚未建立題庫的學科,就無法運用這一方法。雖然可以用BILOG等軟件對有關的二值記分項目進行參數估計,但如果沒有BILOG等軟件又該怎么辦呢?要解決這個問題,需要構造更加復雜的神經網絡模型,筆者目前正在構造“基于知識的級連相關模型”,并試圖用它解決這一困難,實驗結果將另文闡述。
(2)該方法要求實際的測驗中有一部分作為錨題的項目是已知參數的,那么這一部分錨題至少應該是多少項目呢?它們占整個測驗的比例至少要達到多少呢?本實驗表明若錨題數量為15,它們在整個測驗中所占比例為三分之一,就可獲得良好結果,那么少于15個項目行不行?低于三分之一的比例行不行?筆者也正在作進一步的實驗。
(3)本研究中用蒙特卡羅方法產生虛擬的被試能力和項目參數,那么它們的分布應該是什么形式為最好?人工神經網絡的理論認為是均勻分布為最好,因此在本研究中采用了均勻分布。但是在對實際數據的分析中,有些數據是由真實的被試和項目產生的,不可能保證他(它)們呈完全的均勻分布,那么這種偏離均勻分布的情況對于估計值的誤差有多大影響?另外,是否可以減少虛擬數據數量甚至取消虛擬數據,而完全采用真實的數據?也需要進一步探討。
雖然有待于進一步研究的問題還很多,但這一實驗畢竟提出了一種新的、有一定應用價值的方法。
【參考文獻】
[1] Hambleton R K.Item Response Theory:Principles and Appli-cations.Boston:Kluwer-Nijhoff Pub,1985.58~63
[2] Yu J Y.Item Response Theory and Its Application(in Chin-ese).Nanjing:Jiangsu Education Press,1992.79~84
(余嘉元.項目反應理論及其應用.南京:江蘇教育出版社,1992.79~84)
[3] Baker F B.Item Response Theory:Parameter Estimation Tec-hniques.New York:M.Dekker,1992.66~71
[4] McLead P.Introduction to Connectionist Modeling of Cogn-itive Processes.New York:Oxford University Press,1998.256~261
[5] Mahwah N J,Erlbaum L L.Localist Connectionist Approaches to Human
Cognition.New
York:Oxford University Press,1998,188~192
[6] Anderson,J.A.An Introduction to Neural Networks.Cambrid-ge:The MIT Press,1995,136~143.
[7] Yu J Y.Studying perceptual boundary effects with connec-tionist model(in Chinese).Acta Psychologica Sinica,2001,33(2):123~126
(余嘉元.運用聯結主義模型研究知覺邊界效應問題,心理學報,2001,33(2):123~126)
[8] Haykin S S.Neural Networks:A Comprehensive Foundation.Upper Saddle
River,N.N.,Press Hall,1999.178~181
[9] Fahlman S E,Lebiere C.The Cascade-correlation learning architecture.In:Touretzky D S ed.Advances in Neural Informati-on Processing Systems.Los Altos,CA:Morgan Kaufmann,1990.524~532
[10] Samejima F.Homogeneous case of the continuous response
model.Psychometrika,1973,38(3):203~219
[11] Muller H.A Rasch model for continuous ratings.Psychmet-rika,1987,52(2):165~181
[12] Mellenbergh G J.A unidimensional latent trait model forcontinuous item responses.
Multivariate Behavioral Research,1994,29(3):223~236
[13] Qi S Q,Dai H Q.Ding S L.Modern Educational and Psychol-ogical Measurement(in Chinese).Nanchang:Jiangxi Education Pre-ss,1998.126~129
(漆書青,戴海崎,丁樹良.現代教育與心理測量學,南昌:江西教育出版社,1998.126~129)
[14] Mislevy R J,Bock R D.Manual of BILOG 3.Scientific Soft-ware,Inc.1990.27~31
[15] Wang W.Artificial Neural Network Theory:Introduction a-nd Application(in Chinese).Beijing:Beijing Aviation and Space University Press,1995.36~41
(王偉.人工神經網絡原理——入門與應用.北京:北京航空航天大學出版社,1995.26~41)
[16] Zhao L M,Hu H Y,Wei D H.Multilevel Forward Artificial Neural Network(in Chinese).Beijing:Huanghe Water Conservancy Press,1999.52~56
(趙林明,胡浩云,魏德華等.多層前向人工神經網絡,北京:黃河水利出版社,1999.52~56)
篇3
關鍵詞:BP神經網絡; 模糊矩陣; 教學評價
中圖分類號:TP183 文獻標識碼:A文章編號:2095-2163(2013)06-0060-03
0引言
教師教學效果的審核評定是高校教學中的重要工作。傳統的考核方法或者只是由學生填寫調查表,給教師劃分等級,進行定性描述,或者是由督導組根據幾堂課的聽評給教師的課堂教學打出一個分值。無論是哪種方法都不能全面客觀地對教學工作做出科學評定。而且傳統的考核方法受主觀因素影響較大,學生在對教師的評判中常會加入多種因素,各種因素之間的影響也各不相同,僅以學生或僅憑督導團的評定來實施評判顯然已不盡合理。因此, 建立一種能盡量排除各種主觀因素的干擾,同時又具有完善且穩定的評價體系的評定方法則成為必要和重要的研究課題。
本文構建一種教學效果評價體系,即對教師的評價從“教學態度”、“教學內容”、“教授方法”、“課堂效果”四大方面分項進行,無論是學生還是督導組均可據此評價體系給出相應評分。本文提出使用BP反向傳播神經網絡來構建一個穩定的評分系統,各項評分指標為網絡輸入,使用已訓練完成的BP神經網絡來模擬一個專家的打分經驗,由此輸出一個終值。BP神經網絡通常是指基于誤差反向傳播算法的多層前向神經網絡,由于BP網絡的神經元采用的傳遞函數是Sigmoid型可微函數,因而可以實現輸入和輸出間的任意非線性映射[1]。由于BP神經網絡本身就是一種高度復雜的非線性動力系統的辨識模型,并且BP神經網絡具有逼近任意非線性函數的能力[2],因此使用BP神經網絡進行評價將使結果更具客觀性,以此來模擬一個穩定的評分系統亦將具備了現實實現基礎。在本文提出的系統中,系統將評價體系中各組評分的分值作為反向傳播神經網絡的輸入,使用BP網絡運算后得出一個綜合性的評分,即整個過程好似系統模擬一個經驗頗豐的專家進行打分。其后,本文又通過數據測試驗證了模型的評價結果與實際相符。
1BP神經網絡模型
BP(Back Propagation)神經網絡是基于誤差反向傳播的多層前向神經網絡,即權值和閾值的調節規則采用了誤差反向傳播算法,這是一個有導師的神經元網絡學習算法[2]。BP網絡能學習和存儲大量的輸入輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。該網絡的學習規則是使用最速下降法,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。BP神經網絡模型拓撲結構包括輸入層(input)、隱層(hide layer)和輸出層(output layer)。其中的隱層可擴展為多層。只要在隱層中有足夠數量的神經元,就可使用這種網絡來逼近任何一個函數[3]。一個典型的BP網絡結構如圖1所示。
2評價模型的構建
本文構建了一套評價體系,使用一套客觀標準進行量化表達,且該體系適用于大多數學校的教學評價。評價項目中,各項指標的取值范圍為[0,10]。多位專家將根據評價體系方案為每一位參評教師填表打分,經過匯總后,每一個教師的教學情況評分將和一個評價矩陣A對應。列向量x為各個項目指標,行向量e為各位專家評出的各項指標分值。對列向量進行均值計算,則得到各個教師的教學效果指標向量S。所得教學效果指標向量S即是神經網絡的輸入。評價體系方案設計如表1所示。
表1教師教學評價體系
Tab.1 The system of teaching evaluation類別項目教學態度嚴謹負責x0; 思想教育x1;教學內容教學目標x2; 準確度x3; 熟練程度x4; 信息量x5;教授方法啟發思維x6; 講授思路x7;重點難點x8;聯系實際x9;教學儀態x11;語言表述x12;媒體使用x14課堂效果課堂紀律x15;學生思維x16 圖2則為一個由6名專家給出的某位教師教學效果的評分矩陣。
3BP網絡模型的設計與實現
使用BP神經網絡可以構建穩定的評分系統。人為打分時由于主觀因素的影響,分值出入較大,往往不能準確地反映實際情況,為了避免對同一教師的教學評價出現較大反差,構建一個穩定的BP神經網絡系統即已成為實踐發展過程中的一個必然要求。在系統實現過程中,一位專家首先根據本文提出的評分系統給出各項成績,并將此成績作為神經網絡的輸入值。其后,這位專家再給出一個綜合評分,作為神經網絡的樣本,即輸出值,以此即可對BP網絡進行訓練。訓練后的神經網絡就可以模擬該專家的打分經驗,由此構建形成一個穩定的評分系統。
根據BP神經網絡模型的定理(Kolmogrov 定理):給定任一連續函數f:[0,1]nRn,f可以用一個三層前向神經網絡來模擬實現。第一層,即輸入層,有n個神經元;中間層,神經元個數可由經驗公式實驗得出;第三層,輸出層有m個神經元。因此一個三層結構的、設有Sigmoid神經元,并具有足夠隱節點的BP神經網絡則可以逼近任何一個連續函數。本系統采用有三層結構的BP神經網絡,其結構如圖1所示。由于評價體系中有17個指標,因此網絡的輸入層有17個輸入。系統的輸出層則確定為1個節點。隱層神經元個數將根據實驗結果而確定為11個。隱層傳遞函數可使用“lognsig”對數傳遞函數實現,輸出層傳遞函數使用“pureline”純線性傳遞函數實現。訓練函數則使用“traingdm”動量梯度下降反向傳播法對網絡進行訓練,另外,網絡性能函數使用了默認的“mse”均方誤差函數。MATLAB中的主要代碼如下:
設有10位教師需要評分,因而使用10組分數即17×10的矩陣作為10個教師的教學效果矩陣。教學效果矩陣即是神經網絡的輸入矩陣,亦是訓練樣本,矩陣的行向量為各項評價指標,10個樣本,即10位教師的最終評價結果則作為目標樣本來訓練神經網絡,獲取1×10矩陣為目標矩陣,即10位教師的最終得分。實驗中運用Matlab編程建立三層BP神經網絡,目標訓練誤差為0.1,最大訓練次數為 3 000次。訓練誤差隨訓練次數的變化情況如圖3所示,神經網絡經過909步迭代達到精度要求。對應輸出與目標的誤差如圖4所示。
訓練樣本的輸出與專家打分結果比較如表2所示。
由表2可以看出,訓練后的網絡輸出值與專家給出的終值之間的差異均在可接受的指標范圍內,因此采用BP神經網絡可以構建穩定的評分系統。
4結束語
在對教師教學效果的評價中存在著多種因素,本文構建了一套較為合理的評價體系,并且提出使用BP神經網絡對專家評分進行模擬,利用神經網絡可避免打分過程中出現的寬嚴不定的情況。實驗證明,BP神經網絡可以構建穩定的評分系統,并取得了良好的實驗效果。
參考文獻:
[1]許東. 吳錚. 基于Matlab 的系統分析與設計—神經網絡[M]. 西安:西安電子科技大學出版社,2003:18-19.
[2]胡守仁. 神經網絡導論[M] . 長沙:國防科技大學出版社,1993 :113 - 120.
[3]Martin T. Hagan, Howard B.demuth. 神經網絡設計[M]. 北京:機械工業出版社 ,2002:227-255.
[4]郭齊勝. 系統建模原理方法[M]. 長沙:國防科技大學出版社,2003:172-173.
[5]袁劍. BP神經網絡在學生綜合考評中的應用[J]. 福建電腦,2010(6).
篇4
[關鍵詞]動態系統建模 仿真 人工神經網絡
在講授完線性與非線性動態系統建模方法基本理論以后,需要讓學生進行上機實驗[1]以達到以下目的:1進一步加深理解學習的基本理論;2各種參數的選擇對建模效果的影響;3各種建模方法的優缺點及適用場合。為了達到這些目的,我們模擬實際應用時的情況,提供給學生模擬的輸入輸出數據,以便學生利用這些數據,進行編程建立模型。同時我們編程實現基于最小二乘法、最大似然估計、BP神經網絡、RBF神經網絡的動態系統建模方法[2,3],學生可以利用這些Matlab程序進行各種方法的學習、各種情況下建模效果的對比,以及各種方法的適用場合的對比。
一、 基于Matlab仿真的線性動態系統最小二乘法建模的教學
假設系統的差分方程為:y(k)=-a1y(k-1)-a2y(k-2)-…-any(k-n)+b0u(k)+b1u(k-1)+…+bmu(k-m)+e(k)。其中y(k)為輸出,u(k)為輸入,e(k)為模型殘差。假定建模用的數據序列從y(k)開始,則構建以下數據矩陣及數據向量:
如果模型殘差為白噪聲(實際情況多為有色噪聲,但當噪聲強度不大時,可近似當作白噪聲處理),則根據最小二乘法,由這 組數據估計得到的參數 。
以上的最小二乘法需要輸入(u(K-m),u(K-1),…,u(K+N-1))和輸出(y(K-n),y(K-n+1),…,y(K+N-1))數據,我們可用以下的Matlab程序(程序1)產生模擬的輸入輸出數據(程序中采用了一個簡單的二階離散系統,學生實驗時可換成需要的模型),并形成數據矩陣及數據向量。
程序1:
clear all
K=3;%殘差序列開始序號
N=1000;%共N組數據
n=2;%對應
m=2;%對應
u=randn(1,K+N-1)*0.1;%隨機產生輸入數據
for i=1:1:n
y(i)=0;%設定初始狀態
end
for k=n+1:1:K+N-1
y(k)=0.2*y(k-1)+0.5*y(k-2)+u(k)+0.3*u(k-1);%根據輸入計算輸出
end
y=y+randn(1,K+N-1)*0.001; %在求得的單位階躍響應上疊加噪聲用以模擬測量誤差
X=zeros(N,n+m+1);
for i=K:1:K+N-1
for j=1:1:n
X(i-K+1,j)=y(i-j);%構成矩陣X
end
for j=n+1:1:n+m+1
X(i-K+1,j)=u(i-j+n+1); %構成矩陣X
end
end
for i=K:1:K+N-1
Y(i-K+1)=y(i);%構成向量Y
end
save X X;
save Y Y;
save N N;
運行程序1將生產數據矩陣X(保存在X.mat中)及數據向量Y(保存在Y.mat中)。以下是根據最小二乘法估計參數的程序(程序2)。
程序2:
clear all
load X;
load Y;
XT=X';
sita=(XT*X)^(-1)*XT*Y'%計算得到估計的參數sita
運行程序2,將得到估計的參數sita。如某一次運行中sita=[0.2004,0.4998,0.9998,0.2995,-0.0005]T,與模型中的值(見程序1)a1=0.2,a2=0.5,b0=1,b1=0.3,b2=0非常接近。
二、 基于Matlab仿真的線性動態系統最大似然估計建模的教學
在模型殘差為白噪聲的假設下,最大似然估計和最小二乘法在估計參數時是相同的,但最大似然估計還能估計出噪聲的強度,程序3為相應的程序。
程序3:
clear all
load X;
load Y;
load N;
XT=X';
sita=(XT*X)^(-1)*XT*Y'
Z=Y'-X*sita;
StdV=sqrt(Z'*Z/N)%估計標準差
運行程序3,得到和程序2一樣的參數估計值,除此之外,還能得到噪聲的標準差(或方差)。如某一次的運行結果為StdV=0.0011,和模型中值(見程序1)0.001非常接近。
三、 基于Matlab仿真的非線性動態系統BP神經網絡建模的教學
基于神經網絡的非線性動態系統建模的輸入輸出的樣本數據組織如圖1所示。
圖1:基于神經網絡的動態系統建模的樣本數據的組織
如圖1所示,當輸入為y(K-1),y(K-2),…,y(K-n),u(K),u(K-1),…,u(K-m)時,期望輸出為y(K),因此BP神經網絡的輸入輸出數據樣本對為(x,y),其中x,y分別為上述最小二乘法中的數據矩陣及數據向量,將程序1中的動態系統以非線性動態系統代替(如將y(k)=0.2*y(k-1)+0.5*y(k-2)+u(k)+0.3*u(k-1)
改為y(k)=0.2*y(k-1)+0.5*y(k-2)+2*u(k)*u(k)+0.3*u(k-1)),采用程序1產生非線性動態系統的數據,然后設計如下的基于BP神經網絡的非線性動態系統建模程序(程序4)。
程序4:
clear all
load X;
load Y;
net = newff(X',Y,10);
net.trainParam.epochs = 100;
net.trainParam.goal = 0.000001;
net = train(net,X',Y);
Y1 = sim(net,X');
plot(Y,'s-');
hold on
plot(Y1,'*-');
save net net;
從程序4運行后的產生的圖形中可以看出BP神經網絡訓練的效果。
四、 基于RBF神經網絡的非線性動態系統建模教學
基于RBF神經網絡的非線性動態系統建模的樣本數據的組織和BP神經網絡相同,因此可以使用BP神經網絡建模時所用的樣本數據進行建模實驗,以便對比兩種網絡的建模效果。以下(程序5)是RBF神經網絡建模的樣例程序。
程序5:
clear all
load X;
load Y;
net=newrb(X',Y,0.000001);
Y1=sim(net,X');
plot(Y,'s-');
hold on
plot(Y1,'*-');
save net net;
從程序5運行后的產生的圖形中可以看出RBF神經網絡訓練的效果。
五、 結論
本文設計了matlab程序,模擬產生較逼真的輸入輸出數據樣本數據供學生使用,學生可以利用這些數據進行線性與非線性動態系統建模實驗。同時也提供了面向動態系統建模的最小二乘法、最大似然估計、BP神經網絡、RBF神經網絡樣例程序供學生學習使用。學生可以利用這些Matlab程序進行各種方法的學習、各種情況下建模效果的對比,以及各種方法的適用場合的對比。學生也可以參照這些程序編制更加復雜的程序以解決實際的系統建模問題。
基金資助:本文系東華大學信息學院教改項目的研究成果。
[參考文獻]
[1]劉娣許有熊林健,基于MATLAB的“系統辨識”課程實驗教學改革[J].中國電力教育,2013(1):139-140.
[2]王秀峰,盧桂章.系統建模與辨識[M].北京:電子工業出版社,2004.
篇5
關鍵詞:燃氣發電;風險評價;模糊神經網絡;節能減排
引言
隨著環境污染日益嚴重、能源供給壓力不斷增大等問題的凸顯,轉變經濟增長方式,走低碳化發展道路,已經成為世界各國的普遍共識。燃氣發電廠由于使用天然氣等清潔能源,各項排放指標優于燃煤電廠[1,2],使得燃氣發電不僅可以有效減少碳排放,而且可以緩解煤炭等傳統能源的供需壓力。
隨著燃氣發電越來越受到重視,很多學者對燃氣發電進行了實證分析和研究。如文獻[1]分析了我國燃氣發電現狀及規劃,并對行業前景從天然氣開采、發電量等方面進行預測;文獻[3]在隨機生產模擬的基礎上,對天然氣發電效益進行分析;文獻[4-5]從風險評價方面對天然氣市場或發電方面進行研究。本文在已有研究的基礎上,從燃氣發電現狀入手,建立我國燃氣發電行業的風險評價指標體系,結合模糊神經網絡方法,對我國燃氣發電進行風險評價。
1 燃氣發電風險評價指標體系
基于風險評價指標體系的構建原則,本文將我國燃氣發電的風險分為以下五類并進行評價。
(1)資源風險:對于燃氣電廠來說,資源的可采儲量、采選方式可能與計劃結果存在偏差,導致燃氣發電成本增加或發電量乃至電網收到影響。(2)生產風險:燃氣電廠對天然氣供應的要求很高,而其在與天然氣供應商簽訂“照付不議”合同、與電網公司的協調方面,都存在一定程度的不確定性,并會對發電產生影響。(3)技術風險:隨著燃氣發電的應用擴大化和機組大型化趨勢日益明顯,技術和工作原理也更加復雜,因此存在一定的技術風險。(4)市場風險:燃氣發電的市場風險主要包括市場競爭、市場供求和發電效益三個方面[6,7]。(5)環境風險:國內外天然氣、電力市場的變動以及國際經濟形勢也會對燃氣發電的發展起重要作用,因此存在一定的環境風險。
根據上述對燃氣發電風險的分析,構建我國燃氣發電風險評價指標體系,如表1所示。
2 模糊神經網絡模型的構建
2.1 模糊神經網絡結構
模糊神經網絡將模糊理論和神經網絡理論結合起來,本文構建的模糊神經網絡模型采用模糊系統和神經網絡串聯連接方式,即輸入經過隸屬函數轉化為模糊量后,再進入神經網絡系統進行處理[8-10]。模型結構的第1層為輸入層,第2層為模糊化層,第3層為模糊推理層,第4層為輸出層。本文模糊神經網絡結構如圖1所示。
2.2 模糊化處理步驟
根據已建立的燃氣發電風險評價指標體系,采用模糊綜合評價法對燃氣發電風險因素的指標量化處理,使得模糊處理系統的輸出作為神經網絡系統的輸入,具體步驟如下。
(1)確定因素集。根據風險指標體系構造因素集X={x1,x2,…,xk}和每個二級指標的因素集Xi={Xi1,Xi2,...Xin},i=1,2,…k。
(2)確定評語集。對于因素Xi來說,專家對各風險因素逐個給出風險程度評語,將各指標的評語分為m個等級,評語集為Y={y1,y2,…ym}。
(3)做單因素評價,得評價矩陣R。構造模糊映射f,XF(Y),F(Y)是Y上的模糊集,映射f為風險因素xi對評語集Y的隸屬向量Ri={ri1,ri2,…rim},i=1,2…n。由此得到評價矩陣R=(rij)n×m∈F(X×F)。
(4)做綜合評價。對評語集中每個評價指標賦予權重A=(a1,a2,…,an), ai=1,ai?叟0由模糊運算得到一級評價結果B=A?R,并以類似方法求出二級評價結果C=(c1,c2,…,cn),該向量作為神經網絡的輸入。
2.3 神經網絡模型
設輸入層節點數為m,隱含層節點數為e,輸出層節點數為n,其中隱含層節點數通常采用Kol-mogorov定理的經驗處理公式e= +c,式中,c為介于1~10的常數。對任一神經元i,其輸入、輸出關系可表述為Oi=f( ?棕ijhj+?茲i),式中,hj為神經元的第j個輸入,Oi為神經元的第i個輸出;?棕ij是所有與第i個神經元相連的權值;?茲i是神經元第i節點的閾值。f(x)為傳遞函數,一般采用sigmoid型:f(x)=(1+exp(-x))-1。
設有p組訓練樣本,用其中的第k組的樣本的輸入、輸出模式對網絡進行訓練。設定收斂誤差界值為?著min,最大學習次數為N,經過反復迭代運算,根據誤差函數,得出樣本誤差Ek= (hoi(k)-yoi(k)),訓練集誤差E= Ek。若網絡輸出值與期望輸出值之間的誤差不滿足誤差精度要求,則將誤差反向傳播,誤差傳播過程中,要不斷地反復修正網絡中連接權值和閾值,直至滿足誤差精度要求。連接權值和閾值修正公式為?駐k?棕(t+1)=?濁?啄jkoik+?琢?駐k?棕ij(t),?茲j(t+1)=?茲j+ ?駐k?茲j。式中,?濁學習率,?琢為動力因子,二者均介于0到1之間;?琢?駐k?棕ij(t)為動力項,?啄jk為輸出節點計算誤差,t為訓練次數。
3 算例分析
以我國燃氣發電為例,用模糊神經網絡風險評價法對其風險進行評。
(1)確定因素集和評語集,根據評價矩陣得出模糊評價結果。
本文的評價對象為我國燃氣發電風險,由評價體系可知,一級指標因素集為X={x1,x2,x3,x4,x5}={資源風,生產風險,技術風險,市場風險,環境風險},二級指標因素集分別為X1={x11,x12,x13}={儲量風險,開采風險,地理地質條件風險},X2={x21,x22,x23}={天然氣供應風險,燃氣設備選擇風險,技術選擇風險},X3={x31,x32,x33}={技術研發風險,技術成熟度風險,技術應用性風險},X4={x41,x42,x43}={市場競爭風險,市場供求風險,發電效益風險},X5={x51,x52,x53}={國家政策法律風險,國際政治和經濟環境風險,自然環境風險}。評語集為Y={y1,y2,y3,y4,y5}={大,較大,中等,較小,小},相對應的分值為1.0,0.7,0.5,0.3,0.1。由15個專家組成評分小組,得到一級評價矩陣和二級評價矩陣,以及由評價矩陣求得的最大特征向量得到的權重向量得出15個樣本的綜合評價得分矩陣為?滋=(?滋1,?滋2,…,?滋15)=(0.669,0.623,0.691,
0.691,0.611,0.637,0.668,0.582,0.604,0.548,0.612,0.621,0.607,0.641,0.625,0.632)。模糊化后15個樣本各列得分和綜合得分結果如表2所示。
(2)神經網絡訓練和測試階段
設置訓練參數時,在BP神經網絡的訓練選擇22×13×1的網絡結構,訓練最大次N=1000,學習率?濁=0.01,動量因子?琢=0.5,最收斂誤差界?著min=10-4,傳遞函數選擇對數S函數logsig,訓練函數為traingdx,學習函數為learndm,權值矩陣初值由系統隨機給定。BP網絡模型的仿真結果均由Matlab軟件給出。選取表1的前10組數據作為訓練樣本,后5組數據作為測試集,模擬待評估對象。經過BP神經網絡訓練后的前10組樣本輸出結果如下圖2所示。
利用訓練好的BP神經網絡模型對表2中的第11到15組數據進行測試,測試結果如下圖3所示。
將測試結果與專家評價結果進行對比分析,如下表3所示。
表3 BP神經網絡測試結果
由上表看出,5個測試集仿真評價的結果與專家評價結果非常接近,平均相對誤差為2.90%,除了測試樣本13的訓練相對誤差相比于其它測試樣本稍微偏大為8.89%,但是仍保持在較低的誤差水平。因此可以認為所建立的模糊神經網絡模型訓練精度較高,模擬測試結果較好。測試結果顯示,當前我國燃氣發電風險得分值在0.5與0.7之間,根據劃定的評價集,可判斷出當前我國燃氣發電風險為較大和中等之間。
4 結束語
本文運用模糊神經網絡對目前我國燃氣發電風險進行了評價研究,可以得到以下主要結論:
(1)該模糊神經網絡模型能夠充分避免主觀、人為因素的影響,具有自學習、自組織適應能力強等優點,算例分析結果也顯示出該模型訓練精度高,預測結果好,評價結果較為客觀;
(2)建立模糊神經網絡模型應合理確定網絡層數及隱含層的神經元數,設置不合理會影響網絡的學習能力和效率;
(3)基于模糊神經網絡對我國燃氣發電進行評價,有利于業內人士更加客觀、清楚地了解當前我國燃氣發電現狀和問題,從而有利于促進該行業的發展。
參考文獻
[1]張斌.我國天然氣發電現狀及前景分析[J].中國能源,2012,34(11):12-16.
[2]李強.燃氣發電企業的市場營銷戰略[J].現代商業,2007,(36):163.
[3]董軍,陰少華,王江波等.基于隨機生產模擬的天然氣發電環境效益與可靠性效益分析[J].陜西電力,2010,38(7):6-9.
[4]劉毅軍,李松玲,徐小輝等.天然氣產業鏈下游市場風險評價模型探討[J].天然氣工業,2006,26(7):136-138.
[5]熊焰,周偉國,嚴銘卿等.模糊神經網絡在燃氣風險評價的應用[J].煤氣與熱力,2006,26(6):6-9.
[6]唐永偉. 燃氣電廠風險分析[J].中國電力,2002,35(4):1-4.
[7]劉毅軍,夏新生,宋建新.天然氣產業鏈下游市場風險評價指標體系探討[J].天然氣工業,2006,26(增刊):172-174.
[8]魏陽,李凌云,馬明娟等.基于模糊綜合評價法的聚光型太陽能光熱發電風險評價研究[J].陜西電力,2012,40(3):1-5.
[9]M. Mosleha, M. Otadia, S. Abbasbandyb. Evaluation of fuzzy regression models by fuzzy neural network[J]. Journal of Computational and Applied Mathematics, 2011, 234(3):825-834.
[10]陳建宏,胡敏,肖誠等.基于模糊人工神經網絡的金屬礦山投資風險評價[J].廣西大學學報(自然科學版),2011,36(6):1030-1035.
篇6
為尋求一種簡便的船舶運動模型辨識方法,根據船舶動力學與運動學基本方程的結構形式,建立一種基于Elman神經網絡的辨識模型,給出網絡結構的選取和確定方法.以載質量為5萬t的散貨船為例,利用國際海事組織要求的幾個典型的船舶操縱試驗數據對網絡進行訓練,計算權值矩陣,獲得該船舶可用于船舶操縱性分析的神經網絡模型.將網絡計算結果代入船舶運動學方程進行船舶航跡仿真,并與試驗航跡數據進行對比, 驗證網絡模型的精確性.比較仿真驗證結果和試驗數據可知,該網絡模型能基本反映被辨識船舶的動態特性,驗證其有效性和準確性.
關鍵詞:
船舶動力學模型; 船舶運動學方程; 神經網絡; 系統辨識
中圖分類號: U661.33;TP183
文獻標志碼: A
0引言
目前對于船舶操縱運動數學模型的研究基本上從兩方面著手:一是機理建模研究,從基本運動方程出發,通過確定其水動力求解其運動參數的水動力模型;二是辨識建模研究,將船舶看作一個動態系統,舵角作為輸入,船舶運動參數作為輸出,進行水動力參數辨識和函數形式傳遞的船舶模型辨識.前一種方法需要測量和計算復雜的水動力導數,工作量大,而且某些水動力導數的理論估算目前還不能滿足工程精度的要求,只能通過拘束船模試驗精確確定,費用高,可行性較低.后一種方法中的水動力參數辨識,存在無法完全辨識的問題,而傳遞函數形式的船舶模型,更適合于寬闊水域的船舶操縱,不適合具有高強機動性的船舶操縱控制,若要應用于仿真,還需補充目前尚無統一形式的船舶縱向方程[1].近幾年,隨著神經網絡研究的再度興起,神經網絡在模式識別、系統辨識、圖像處理和自動控制等眾多領域得到廣泛應用[24],在運動建模與仿真,特別是在船舶操縱性中的應用也越來越受到國內外眾多學者[58]的關注.神經網絡具有自學習、自適應的能力,能夠從輸入數據中自動學習,抽取包含在數據中的映射關系,因此可以用來學習船舶在航行過程中的動態操縱特性.目前, 在系統辨識中應用最多的是多層前向網絡. 該網絡具有逼近任意連續非線性函數的能力, 但這種網絡結構一般是靜態的, 而人們更關心控制系統的動態特性, 這恰恰是反向傳播(BackPropagation,BP)神經網絡等前饋型網絡所缺乏的.與靜態前饋型神經網絡不同,動態遞歸網絡通過存儲內部狀態使其具備映射動態特征的功能, 從而使系統具有適應時變特性的能力, 更適合于非線性動態系統的辨識.動態遞歸神經網絡是控制系統建模和辨識中極具發展潛力的網絡.[9]本文將動態遞歸神經網絡應用于船舶操縱運動辨識,建立一種基于Elman神經網絡的辨識模型.該網絡模型與已知的船舶動力學基本模型相對應,使網絡結構具有明確的物理意義.隨后,利用幾種典型的船舶操縱性試驗數據對網絡模型進行訓練和驗證,得到比較滿意的結果.
1船舶運動數學模型
船舶的實際運動是一種具有6個自由度的異常復雜的運動.對大多數情況下的船舶運動及控制而言,可以忽略船舶垂蕩、橫搖和縱搖運動.國際海事組織(International Maritime Organization,IMO)要求的幾種典型的船舶操縱性試驗極少包含對船舶垂蕩、橫搖和縱搖運動的數據記錄.本文的主要目的在于驗證Elman神經網絡對船舶運動辨識的可行性.考慮上述原因,僅對船舶3自由度運動進行辨識與建模,不考慮風、浪和流等外界條件的影響.
船舶3自由度的動力學方程[5]為
篇7
Abstract: In the view of the shortage of the Wavelet Neural Network Algorithm, adapt Adaptive Inertia Weight Particle Swarm Optimization Algorithm(AIW-PSO) as a study algorithm, build the AIW-PSO Wavelet Neural Network Model to predict the Shanghai stock Index., and make a comparison between the results of improved algorithm prediction model with results of traditional Wavelet Neural Network Model. The results show that the AIW-PSO Wavelet Neural Network Prediction Model has better prediction results on the Shanghai Stock Index.
關鍵詞: 自適應慣性權重粒子群優化算法;小波神經網絡;上證指數預測
Key words: Adaptive Inertia Weight Particle Swarm Optimization;Wavelet Neural Network;Shanghai Stock Index Prediction
中圖分類號:F832.5;F224 文獻標識碼:A 文章編號:1006-4311(2014)08-0006-03
0 引言
股票市場預測是一個非線性函數值估計和外推問題,隨著股市預測問題的復雜性增高,僅僅依靠傳統的預測方法或是單一的人工智能模型已經不足以達到人們所期望的要求。近年來,學者們試圖將多種股市預測技術結合,使它們優劣互補,從而達到更加理想的股市預測效果。殷光偉、藺玉佩[1]應用小波理論對混沌模型預測的結果予以重構,實現對原始收益率的預測,結果有了更高的精度。王剛[2]等利用小波將股指數據進行去噪處理,然后利用BP神經網絡進行預測分析,試驗結果精準度相對于BP神經網絡方法更高、效果更好。劉海珗[3]等將AR模型、RBF和GRNN神經網絡模型進行比較,結果表明若神經網絡選擇恰當的學習算法時,對上證指數預測結果會更優越。肖冬榮等[4]采用PSO算法訓練神經網絡對股市進行預測,實證結果表明改進算法易實現且預測精度高。文獻[5、6]提出了將遺傳算法與BP神經網絡相結合對股市價格進行預測,實證仿真結果證實該改進模型的優越性。Yoshinori[7]等將小波系數作為特征量輸入于多階段模糊推理系統中,并價格漲落進行預測。Taeksoo[8]等利用遺傳算法和神經網絡將小波系數加權后作為特征量預測匯率,效果同樣相對較好。而隨著小波神經網絡快速發展,這些年來其優越的性能使其得到了廣泛的應用,但其學習算法的一些缺陷對其在股市預測中的應用得到了限制。而本文所提出的一種自適應粒子群優化算法尋優等能力突出、簡單易實現等優勢會克服原有缺陷,而將AIW-PSO算法與小波神經網絡結合后的新技術將會成為一種全新的、更優越的股票市場預測方法。
1 自適應慣性權重粒子群優化算法
自從粒子群算法被提出以來不少學者也是提出各種各樣的改進算法來克服其收斂快、容易陷入局部極小值等缺點。如通過產生多子群、增加自適應變異、魚群算法中聚群行為、混沌理論等去改進粒子群,但在這么多改進算法中必然會存在一些如相互結合的算法之間的性能相互抵消及相互影響等情況,從而導致改進算法在做預測時的結果出現一種“假”的精度高等現象。故本文結合文獻[9、10]中所提出的一種自適應慣性權重粒子群優化算法,選擇該方法作為小波神經網絡的學習算法,來指導小波神經網絡的模型擬合。
由PSO算法的基本原理中粒子的位置和速度方程可知,其中ω是為非負數的慣性權重,它使粒子保持運動慣性,使其具有擴展收縮空間的趨勢,有助于新區域的搜索。設ωmax為最大慣性權重,ωmin為最小慣性權重,k為當前迭代次數,kmax為算法迭代總次數,則自適應慣性權重ω的方程如下:
ω=ωmax-k(ωmax-ωmin)/kmax
根據個體粒子的尋優能力,給出自適應慣性權重來調整全局搜索能力和局部開發能力。每一維每個粒子在每次迭代時都有不同的慣性權重,這對于提高收斂精度上有較好的效果。而實際應用中常將慣性因子ωmax和ωmin分別設為0.9和0.4。
2 基于AIW-PSO小波神經網絡預測模型
由上述AIW-PSO算法原理及算法流程,本小節試圖將AIW-PSO算法的尋優機制作為學習策略添加到小波神經網絡訓練過程中,構建AIW-PSO小波神經網絡,令小波神經網絡和AIW-PSO算法相互取長補短。對于小波神經網絡結構問題,輸入層節點數為m,隱含層節點數為n,輸出層節點數為k,則優化維度D=n×m+k×n+n+n。假設1:輸入層到隱含層的權值矩陣為Wkj,隱含層和輸出層的權值矩陣Wji;假設2:小波基函數平移系數bj,向量為B1=(b1,b2,…,bj);小波基函數伸縮系數aj,向量為B2=(a1,a2,…,aj);故單個粒子在維度上的順序編碼為包括以上假設1和假設2中的矩陣和向量中的所有元素的一行或一列的向量x=(W11,…,Wkj,W11,…,Wji b1,…,bj,a1,…,aj)。
優化單隱層小波神經網絡結構的主要步驟和基本流程為:
步驟1:對小波神經網絡的權值、小波基函數平移系數和伸縮系數進行結構編碼,使其對應于AIW-PSO算法中的個體;
步驟2:將權值和小波基函數平移系數和伸縮系數的取值區間賦予AIW-PSO算法的種群,隨機初始化種群;
步驟3:結合問題,設定網絡類型、結構、小波基函數及初始化各項參數,生成新的網絡模型;
步驟4:分別將種群的維度信息解碼為網絡模型各項參數,對網絡進行仿真輸出,計算均方誤差MSE作為算法的適應度;
步驟5:按照AIW-PSO算法的尋優方式進行迭代,直到某一個體的適應度滿足要求,或達到最大迭代步數則終止算法;
步驟6:將算法的最優解解碼給小波神經網絡,得到經過優化后的WNN模型,進行預測。
AIW-PSO算法訓練小波神經網絡模型的基本流程如圖1所示。
3 應用分析
股票指數時間序列是一個很不穩定的動態變化過程,其影響因素眾多,其中包括如宏觀、微觀、政治、經濟等因素。如何在上述眾多的影響因素中選取主要影響指標作為上證指數預測模型的輸入變量將會是一個十分關鍵的問題。根據文獻中和現實股票市場情況,輸出變量選為第t 日的收盤價,而影響指標選取為上證指數第t-1日的開盤價、最低價、最高價、收盤價和交易量信息共五個。實驗數據選取多少應看所預測的指數。過多會增加收集,過少則可能導致結果偏差。故本文所采集的數據是從2010年8月6日至2011年8月6日的一年的共243組上證指數序列,其中前195組用來訓練,后48 組用來預測。為了消除數據之間的影響,本文利用歸一化函數將原始數據的序列歸一化到[-1,1]之間,再利用反歸一化函數將模擬結果還原到上證指數的時間序列。本文選取的WNN隱含層激勵函數為最常用的具有良好的時頻局部性的Morlet小波,而各層神經元數根據預測的上證指數和影響指標個數設為:輸入層為5,輸出層為1。根據經驗公式及反復測試后隱含層小波基函數個數取10,此時AIW-PSO算法中粒子維度D為80,粒子個數S=40,粒子個體參數初始為(-1,1)的數值,常數c1=c2=2,本文中常將粒子最大速度Vmax初始化為0.5,粒子位置的最大值Xmax 確定為1,最大迭代次數kmax為500。
為了而體現改進算法預測的優越性,固將AIW-PSO小波神經網絡預測模型與傳統小波神經網絡預測模型進行對比。兩種預測模型程序在matlab2012a工具環境下分別進行5次測試,測試結果如表1所示。
由實驗各項結果可知,基于小波神經網絡的模型結果不太穩定,波動較大,MAPE值在1.53%-9.03%之間。為了體現AIW-PSO小波神經網絡的優越性,在此我們取該模型最好的預測結果,即預測誤差百分比MAPE為1.53%,此時訓練樣本的均方誤差MSE指標為0.0163,測試樣本的預測結果見圖2。對于AIW-PSO小波神經網絡預測模型預測結果來說,無論是在預測結果穩定性和預測精度方面都較小波神經網絡有明顯提高,5次測試中MAPE值都在0.99%-1.25%之間,足以說明該預測模型的優越性,測試樣本的預測結果見圖3。
4 結語
用自適應慣性權重粒子群優化算法訓練小波神經網絡能夠起到很好的網絡權值和系數優化效果,而兩種算法預測模型結果對比分析表明,本文所建立AIW-PSO小波神經網絡預測模型無論是在測試MAPE、預測穩定性、預測精度上都相對傳統小波神經網絡優越。說明AIW-PSO小波神經網絡預測模型具有更加優越的性能,將會是成為股市預測的一種新型混合算法預測工具。
參考文獻:
[1]殷光偉,鄭丕諤.基于小波與混沌集成的中國股票市場預測[J].系統工程理論方法應用,2004,13(6):554-547.
[2]王剛,許曉兵.基于小波分析與神經網絡時間序列的股票預測方法[J].金融經濟,2013,4(12):161-162.
[3]劉海珗,白艷萍.時間序列模型和神經網絡模型在股票預測中的分析[J].數學的實踐與認識,2011,3(2):14-19.
[4]肖冬榮,楊子天.基于粒子群訓練的神經網絡股票預測模型[J].統計與決策,2009,12(2):20-22.
[5]孟祥澤,劉新勇,車海平,袁著祉.基于遺傳算法的模糊神經網絡股市建模與預測[J].信息與控制,1997,13(10):388-392.
[6]歐陽林群.GA神經網絡在證券市場預測中的應用研究[J].湖北武漢理工大學學報(信息與管理工程版),2006,28(11):160-163.
[7]Yoshinori K, Shozo.T. Prediction of Stock Trends by Using the Wavelet Transform and the Multi-stage Fuzzy Inferenle System Optimized by the GA[J]. IEICE Trams Fundamentals, 2000, 83(2): 357-366.
[8]Taeksoo S,Ingoo H. Optimal signal multi-resolution by genetic algorithm to Support Artificial neural network for exchange rate forecasting[J]. Expert System with Applications, 2000, 18(4): 257-269.
篇8
關鍵字:智能手機;安全;神經網絡;病毒病毒識別模型在智能手機監測中的優越性以及可行性。
0 引言
現階段,互聯網已成為當今社會不可或缺的一部分,智能手機的數量也是與日俱增,與此同時不斷發展的是手機病毒,手機病毒已成為現代病毒發展的趨勢。
所謂手機病毒,其實是一種破壞手機系統的程序,且其傳播手段極為廣泛,可通過短信、彩信、郵件、網站或者下載文件、藍牙等傳播,手機一旦被病毒感染就會根據所感染病毒程序的要求對手機實施破壞,其表現方式不盡相同,可以使關機、死機、刪除手機資料、自動通話、發郵件等,有的病毒還能夠破壞手機SIM卡和芯片等手機硬件設備。
怎樣才能避免手機遭受病毒的破壞?其主要措施還是殺毒軟件和防火墻:
①定期對殺毒軟件的病毒庫進行更新升級,盡可能的保證其擁有當時已出現的病毒程序的破解,若病毒庫中不存在某個病毒的特征,則殺毒軟件就不能對該病毒進行查殺。此外,現在的手機殺毒軟件病毒庫采用的是特征代碼法,病毒的細微的變化都需要病毒庫對其進行辨別,然而智能手機的存儲空間和運算能力都是有限的,所以這種防殺毒的方法對智能手機而言,并不是完美的。
②而智能手機的防火墻主要的作用是攔截騷擾電話等,而并不是對手機病毒進行監控,面對現存的多樣易變的病毒,防火墻更是顯得微不足道。
究竟該選擇何種方式來保護手機,這也是本文研究的重點―神經網絡。
1 神經網絡
神經網絡是依據生物神經的機制和原理,對信息進行處理的一種模型。它能夠模擬動物大腦的某些機制機理,實現一些特定的功能。人工神經網絡具有很大的優越性:
①具有自學功能。比如說,當對一幅圖像進行識別時,將各種不同的圖像樣本及其對應的結果輸入人工神經網絡,它就能夠自己學習識別相同類型的圖像。
②具有聯想存儲功能。人工神經網絡中的反饋網絡具備了聯想存儲的功能。
③具有高速尋找優化解的功能。
2 神經網絡安全監控系統
神經網絡安全監控系統就是監控手機應用程序,使手機的正常業務能夠順利進行,而對那些異常業務則進行阻止。所謂正常的業務就是那些手機用戶已知的、按照用戶的意愿運行的、并且其運行并不破壞用戶手機中的資源和產生額外費用的已經授權的程序。
通過神經網絡監控手機的而應用程序的流程圖如圖1所示:
圖1 神經網絡安全監控流程圖圖2 單層感知器神經網絡結構
神經網絡智能手機安全監控的第一步是獲取所運行程序的特征,然后借助于神經網絡的識別功能,對所提取的應用程序的行為特征進行識別,如果識別結果為病毒手機會向用戶發出提示信息,若不為病毒則程序將繼續運行。
3.1 程序行為特征的獲取
這里舉個例子說明。例如OwnSkin.A病毒,該病毒以手機主題的形式誘導手機用戶進行下載安裝,一旦該病毒被安裝進了手機,它就會在用戶不知情的情況下自動連接網絡,自動想外界批量發送短信,對手機收到的短信的信息內容進行刪除等等。從對病毒的描述詳細程度方面來說,病毒具有很多種特征,本文以3個為例,進行說明,這3個特征分別是有無按鍵、是否自啟動、是否特殊號碼,程序行為特征獲取的方法如下:
①針對手機自啟動的行為特征:每種手機的系統,都有其正常的程序啟動方式,例如Windows Mobile通過“啟動”設置,Symbian的系統式通過“Recognizer”來設置程序的啟動,Linux系統是將啟動語句加入/ect/init.d/rcs,或者/usr/etc/rc.local中,在程序啟動的時候對這些個位置進行監控,就可以很容易的判別其是否為自啟動。
②針對按鍵這個行為特征:塞班的系統對是否有按鍵這個行為特征的監控是粗略的監控,以短信為例,手機短信的使用一般是先按功能鍵啟動功能圖標,然后選取短信的圖標,接著是對短信內容的編輯,即一系列的數字鍵,監控可得到一個相應的按鍵序列,這樣就可以通過是否有按鍵這個行為特征來監測手機程序的啟動是否正常。
③針對“被叫號碼”和“文件信息”的特征: 對于被叫號碼主要執行的是,查看所要撥出去的電話號碼是否是設置在黑名單里的電話,對于文件信息則是查看信息中所添加的附件是否是安裝文件,如果是手機用戶之間的正常傳輸行為,則必定有按鍵行為特征,這樣也就會避免手機中的病毒程序隱蔽性的自啟動來傳輸文件。
3.2 神經網絡建模
仍舊以上述3個行為特征為例,將其三個特征分別用“0”或者“1”來表示,若無按鍵、自啟動、特殊號碼,其特征值都取“1”,反之則取“0”,這三個特征值一共組合成了8中可能出現的情況,將其標記為矩陣如下:
(1)
借助于神經網絡的識別功能,本文以單層單神經元的神經網絡為例進行說明,采用以下的參數對神經網絡進行設計:
該網絡包含有一個輸入向量,包汗三個元素,并且每個元素取0―1之間的值。
神經網絡中的神經元通過hardlim函數為傳輸手段,根據這個函數設計出如圖2所示的神經網絡結構,:
(2)
該結構輸出結果為二值向量“0”或者“1”,其中“0”表示不是病毒特征,“1”則表示是行為特征。
在智能手機的實際應用中,傳輸函數和網絡結構、層數極易神經元等的類型多種多樣,可根據病毒的實際情況進行選擇和應用,在此筆者只是舉個例子來論述神經網絡是如何識別網絡的。當網絡建好之后,就需要通過適當的方法對病毒樣本進行訓練得出誤差。
仍以上述例子為例進行訓練:
輸入向量為:p= ;目標向量選為:t= ,在MATLAB7.1的環境中對病毒進行訓練,根據所的結果得出訓練的誤差性能曲線,如圖3所示:
圖3 訓練誤差性能曲線
經過訓練并獲取矩陣權重,至此,神經網絡的建模基本完成,其模型為
a=hardlim(P1*2+P2*2+P3*1-3)
在手機中所執行的應用程序,計算程序的行為特征向量與病毒的行為特征向量(111)之間的歐式距離,當所得之數比程序的特征行為向量和正常行為特征向量之間的歐式距離大時,系統將將此程序判定為病毒。
運用神經網絡系統對手機進行監測不需要像殺毒軟件一樣需要定期更新,這對手機的安全具有更好的防護作用。
3結語
隨著現代社會智能手機數量的增多和日常化,網絡黑客技術也在不斷的發展和完善,因此智能手機安全問題已然不能忽視或者小視。本文針對這個問題,以及殺毒軟件和防火墻的不足之處,論述了神經網絡病毒識別模型在智能手機監測中的優越性以及可行性。
參考文獻
[1]劉一靜,孫瑩,藺洋. 基于手機病毒攻擊方式的研究[J]信息安全與通信保密, 2007, (12) .
[2]李錦. 手機病毒特點及防范對策[J]通信技術, 2009, (02) .
[3]楊建強,吳釗,李學鋒. 增強智能手機安全的動態惡意軟件分析系統[J]. 計算機工程與設計, 2010, (13) .
[4]智能手機安全防護框架淺析[J]. 信息安全與通信保密, 2010, (10).
篇9
關鍵詞:LM-BP網絡;糧食產量;預測
中圖分類號:S11+4;TP183 文獻標識碼:A 文章編號:0439-8114(2012)23-5479-03
Forecasting Corn Production Based on LM-BP Neural Network
GUO Qing-chun1,3,4,HE Zhen-fang2,4,LI Li3
(1. Teaching Affairs Office, Shaanxi Radio & TV University, Xi’an 710068, China; 2. Cold and Arid Regions Environmental and Engineering Research Institute, Chinese Academy of Sciences, Lanzhou 730000, China; 3. Institute of Earth Environment Research, Chinese Academy of Sciences, Xi’an 710075, China; 4. Graduate University, Chinese Academy of Sciences, Beijing 100049, China)
Abstract: A corn production porecasting method based on improved LM-BP was proposed. According to measurement and agricultural significance principle, 9 factors of grain-sown area, fertilizer input, effective grain irrigated area, stricken area, rural electricity consumption, total agriculture mechanism power, the population engaged in agriculture, rural residents family productive assets, the average net income of rural households were extracted as the network input; corn production was extracted as the network output. The LM algorithm could minimize the error, and the modeling results were evaluated with the correlation coefficients, relative error, etc. For training sample set, the correlation coefficient between the simulated value and the actual value was 0.996, the average relative error was 0.47%; for testing sample set, the correlation coefficient between the forecasted value and the actual value was 0.994, the average relative error was 0.56%. The results showed that the improved LM-BP model could improve simulation precision and stability of the model. This method is effective and feasible for corn production prediction.
Key words: LM-BP network; corn production; forecast
糧食產量預測是復雜的農學和統計學問題,受自然環境、政策、資源投入等多因素的影響。國內外的相關研究中,不少學者構建了許多很有價值的理論假說和預測模型,主要有4類:投入產出模型、遙感技術預測模型、氣候生產力模型及多元回歸和因子分析模型,這些模型從不同角度對糧食產量預測進行了研究[1,2]。但這些模型多數采用傳統的統計預測技術,如時間序列統計模型、定性與推斷技術、因果關系方法。而糧食產量是受不確定性因素影響的,是一個復雜的非線性系統。
人工神經網絡具有很強的處理大規模復雜非線性系統的能力。近年來,許多學者已將人工神經網絡成功地應用于實際問題的預測中,取得了令人滿意的結果[3-12]。為此,采用改進算法的神經網絡建立了糧食產量預測系統,結果表明,基于改進算法的BP神經網絡預測模型具有良好的預測精度、訓練時間短、收斂速度快等特點。
1 仿真試驗數據
1.1 預測因子的選擇
根據能夠計量及具有農學意義的原則,結合農業專家的意見,通過前期大量的影響因子分析[13-15],選取1994-2009年的糧食總產量為輸出因子,初步選取糧食作物播種面積、化肥施用量、糧食作物有效灌溉面積、受災面積、農村用電量、農業機械總動力、從事農業的人口、農村居民家庭生產性固定資產原值、農村居民家庭平均純收入9個因子作為輸入因子構筑模型,原始數據來源于2010年《中國統計年鑒》。
1.2 網絡輸入的初始化
為了消除不同因子之間由于量綱和數值大小的差異而造成的誤差,以及由于輸入數值過大造成溢出,首先需要對數據進行標準化處理,即把輸入數據轉化為[0,1]或[-1,1]的數。通過公式y=(x-min(x))/(max(x)-min(x))對糧食產量進行處理,得到了符合網絡要求的數據。減少了識別數據的動態范圍,使預測成功的可能性得以提高。然后將數據分成兩部分:網絡的訓練樣本集(前11年的數據)和檢測樣本集(后5年的數據)。
2 預測仿真模型的建立
BP網絡是誤差反向傳播(Back Propagation)人工神經網絡的簡稱,是目前計算方法比較成熟、應用比較廣泛、效果比較好、模擬生態經濟系統的神經網絡模型,但傳統BP網絡存在學習過程收斂慢,局部極小、魯棒性不好、網絡性能差等缺點。為了改進算法,引入Levenberg-Marquardt優化算法,其基本思路是使其每次迭代不再沿著單一的負梯度方向,而是允許誤差沿著惡化的方向進行搜索,同時通過在最速梯度下降法和高斯-牛頓法之間自適應調整來優化網絡權值,使網絡能夠有效收斂,大大提高網絡的收斂速度和泛化能力,它能夠降低網絡對誤差曲面局部細節的敏感性,有效抑制網絡陷入局部極小。
Levenberg-Marquardt算法實際上是梯度下降法和擬牛頓法的結合,該算法期望在不計算Hessian矩陣的情況下獲得高階的訓練速度,其公式表達為XK+1=XK-[JTJ+μI]-1JTe,其中,JT為雅克比矩陣,e是網絡誤差向量。如果μ=0的話,就變成采用近似Hessian矩陣的擬牛頓法;如果μ很大,即成為小步長的梯度下降法,由于牛頓法在誤差極小點附近通常能夠收斂得更快更準確,因此算法的目的就是盡快轉換為牛頓法。如果某次迭代成功,誤差性能函數減小,那么就減小μ值,而如果迭代失敗,就增加μ值。如此可以使得誤差性能函數隨著迭代的進行而下降到極小值。Matlab工具箱提供了Trainlm 函數Levenberg-Marquardt算法的計算。
網絡結構的選擇是應用BP網絡成功與否的關鍵因素之一,一個規模過大的神經網絡容易造成網絡容錯性能下降、網絡結構復雜、泛化能力較差等缺陷;而規模過小的神經網絡往往對訓練樣本的學習較為困難,學習過程可能不收斂,影響網絡的表現能力,降低網絡應用的精度。理論研究表明,只要具有足夠的隱層神經元,3層人工神經網絡可以無限地逼近任何時間序列和函數,因此這里采用含有一個隱含層的3層神經網絡結構。隱含層神經元數的選擇較為復雜,它關系到整個BP網絡的精確度和學習效率,但目前,它的選取尚無一般的指導原則,只能根據一些經驗法則或通過試驗來確定,如Hecht-Nielsen提出的“2N+1”法,由輸入矩陣可以確定輸入層節點數為9,根據“2N+1”這一經驗,可確定隱含層節點數為19;輸出層節點數為1,這樣就構成了一個9-19-1的BP神經網絡模型,其中,訓練函數為Trainlm,輸入層到隱含層以及隱含層到輸出層的傳遞函數分別為Logsig和Purelm,最大訓練次數Epochs為50 000次;訓練誤差精度Goal為0.001;訓練時間間隔Show為5,學習步長Lc為0.5,動量因子Me為0.95,其他參數均選用缺省值。
3 仿真結果
取1994-2004年的11個實際產量作為訓練樣本集,將2005-2009年的5個實際產量作為預測效果檢測樣本集。將1994-2004年9個指標的原始數據作為BP神經網絡的輸入樣本,糧食產量實際值作為輸出樣本,然后對網絡進行訓練,可得相應結點的權值與閾值,將2005-2009年9個指標的原始數據(檢測樣本)作為網絡的仿真輸入,得到最終預測結果,表1是1994-2009年中國糧食實際產量和神經網絡方法模擬值對比分析結果。
從表1可以看出,訓練樣本集中擬合精度平均相對誤差為0.47%,最大值為2004年的1.13%,模擬值和實際值的相關系數為0.996;檢測樣本集中,BP神經網絡預測模型得到的預測值和實際值具有較好的擬合效果,平均相對誤差為0.56%,最大相對誤差為1.11%,最小相對誤差僅為0.04%,模擬值和實際值的相關系數為0.994;2005-2009年的糧食產量預測值的相對誤差均較小。這種改進后的方法比較有效,利用該算法獲得的預測數據結果較好。
總之,由以上分析結果可以看出,無論是擬合精度還是預測5個獨立樣本,BP神經網絡模型的精度都比較高。但從預測結果也可以看出,BP網絡模型方法預測的平均相對誤差為0.56%,平均預測精度仍有待提高。
4 小結與討論
針對中國糧食產量預測問題,將BP神經網絡應用于國家糧食安全預警系統中,采用1994-2004年的中國糧食產量和影響因子的歷史數據建立模型,利用2005-2009年的數據檢驗模型,研究得出以下結論。
1)由于常規統計模型難以滿足糧食產量的預測要求,提出的改進BP算法較好地解決了神經網絡收斂慢和易陷入局部極小值的問題,通過建立預測模型,運用該改進方法對中國糧食產量進行了預測,實例證明,運用基于Levenberg-Marquardt算法的改進BP神經網絡,無論從訓練結果精度上還是在收斂性能上都表現出較好的效果,說明運用該方法來預測糧食產量是完全可行的,彌補了傳統BP算法的不足,提高了預測精度,加快了收斂速度,而且具有很好的外延性。
2)BP神經網絡模型的預測精度高,預測值和實際產量的擬合性好。BP神經網絡法允許原始的隨機數據或數據中含有較多的噪聲,這是它區別于其他模型的最大優勢,因而任何能用傳統的模型分析或統計方法解決的問題,BP神經網絡能處理得更好。在進行糧食產量預測時,BP神經網絡法是一種非常理想的預測方法,但是在構造神經網絡的預測模型時,要注意正確選擇影響因素,不要漏掉對預測對象有重大影響的因素。
由于糧食產量受各種因素的影響,波動性較大,除了受到上述9種因素的影響外,在很大程度上還受國家宏觀政策、作物品種、耕作技術等因素的影響,如何更全面地將難以量化的因素也納入模型中進行考慮分析,從而不斷地改進預測模型、提高預測精度,是需要進一步研究的工作。
參考文獻:
[1] 和文超,師學義,鄧青云,等.土地利用規劃修編中糧食產量預測方法比較[J].農業工程學報,2011,27(12):348-352.
[2] 周永生,肖玉歡,黃潤生. 基于多元線性回歸的廣西糧食產量預測[J]. 南方農業學報,2011,42(9):1165-1167.
[3] 王巧華,文友先.基于BP神經網絡的雞蛋大小分級方法研究[J].湖北農業科學,2005(1):97-99.
[4] 于平福,陸宇明,韋莉萍,等.基于小波廣義回歸神經網絡的糧食產量預測模型[J].湖北農業科學,2011,50(10):2135-2137.
[5] 李紅平,魏振方,郭衛霞.小麥白粉病的數學模型預測[J].湖北農業科學,2011,50(17):3611-3613.
[6] 李 艷,劉 軍.農產品價格預測系統設計與實現[J].湖北農業科學,2011,50(14):2976-2978.
[7] 黃 華,黎未然.人工神經網絡在柚皮總黃酮提取中的應用[J].湖北農業科學,2011,50(10):2088-2091.
[8] 汪東升,李小昱,李 鵬,等.基于小波和神經網絡的柴油機失火故障檢測[J].湖北農業科學,2011,50(15):3181-3183.
[9] 梁 丹,李小昱,李培武,等.近紅外光譜法對食用植物油品種的快速鑒別[J].湖北農業科學,2011,50(16):3383-3385.
[10] 吳澤鑫,李小昱,王 為,等. 基于近紅外光譜的番茄農藥殘留無損檢測方法研究[J].湖北農業科學,2010,49(4):961-963.
[11] 章 英.基于收購質量的烤煙煙葉無損檢測技術研究綜述[J].湖北農業科學,2011,50(7):1297-1300.
[12] 李 哲,李干瓊,董曉霞,等.農產品市場價格短期預測研究進展[J]. 湖北農業科學,2011,50(17):3666-3675.
[13] 宰松梅,溫 季,仵 峰,等.基于灰色關聯分析的遼寧省糧食產量預測模型[J].節水灌溉,2011(5):64-66.
篇10
關鍵詞性能對比感知器BP網絡霍普菲爾德網絡字符識別
1引言
人工神經網絡是在人類對其大腦神經網絡認識理解的基礎上人工構造的能夠實現某種功能的神經網絡。 它是理論化的人腦神經網絡的數學模型,是基于模仿大腦神經網絡結構和功能而建立的一種信息處理系統。因其自組織、自學習能力以及具有信息的分布式存儲和并行處理,信息存儲與處理的合一等特點得到了廣泛的關注,已經發展了上百種人工神經網絡。
一般來說,人工神經網絡從結構上可分為兩種:前向網絡和反饋網絡。典型的前向網絡有單層感知器、BP網絡等,反饋網絡有霍普菲爾德網絡等[1]。
人工神經網絡已經被廣泛應用于模式識別、信號處理、專家系統、優化組合、智能控制等各個方面,其中采用人工神經網絡進行模式識別具有一些傳統技術所沒有的優點:良好的容錯能力[2j、分類能力、并行處理能力和自學習能力,并且其運行速度快,自適應性能好,具有較高的分辨率。單層感知器、BP網絡和霍普菲爾德網絡均可以用于字符識別。
本文通過具體采用感知器網絡、BP網絡和霍普菲爾德反饋網絡對26個英文字母進行識別的應用,通過實驗給出各自的識別出錯率,通過比較,可以看出這3種神經網絡的識別能力以及各自的優缺點。
2 字符識別問題描述與網絡識別前的預處理
字符識別在現代日常生活的應用越來越廣泛,比如車輛牌照自動識別系統[3,4],手寫識別系統[5],辦公自動化等等[6]。畢業論文 本文采用單層感知器、BP網絡和霍普菲爾德網絡對26個英文字母進行識別。首先將待識別的26個字母中的每一個字母都通過長和寬分別為7×5的方格進行數字化處理,并用一個向量表示。其相應有數據的位置置為1,其他位置置為O。圖1給出了字母A、B和C的數字化過程,其中最左邊的為字母A的數字化處理結果所得對應的向量為:IetterA~「00100010100101010001111111000110001〕’,由此可得每個字母由35個元素組成一個向量。由26個標準字母組成的輸人向量被定義為一個輸人向量矩陣alphabet,即神經網絡的樣本輸人為一個35×26的矩陣。其中alphabet=[letterA,letterB,lettere,……letterZj。網絡樣本輸出需要一個對26個輸人字母進行區分輸出向量,對于任意一個輸人字母,網絡輸出在字母對應的順序位置上的值為1,其余為O,即網絡輸出矩陣為對角線上為1的26×26的單位陣,定義target=eye(26)。
本文共有兩類這樣的數據作為輸人:一類是理想的標準輸人信號;另一類是在標準輸人信號中加上用MATLAB工具箱里的噪聲信號,即randn函數。
3 識別字符的網絡設計及其實驗分析
3.1單層感知器的設計及其識別效果
選取網絡35個輸人節點和26個輸出節點,設置目標誤差為0.0001,最大訓練次數為40。設計出的網絡使輸出矢量在正確的位置上輸出為1,在其他位置上輸出為O。醫學論文 首先用理想輸人信號訓練網絡,得到無噪聲訓練結果,然后用兩組標準輸入矢量加上兩組帶有隨機噪聲的輸人矢量訓練網絡,這樣可以保證網絡同時具有對理想輸人和噪聲輸人分類的能力。網絡訓練完后,為保證網絡能準確無誤地識別出理想的字符,再用無噪聲的標準輸入訓練網絡,最終得到有能力識別帶有噪聲輸人的網絡。下一步是對所設計的網絡進行性能測試:給網絡輸人任意字母,并在其上加人具有平均值從。~0.2的噪聲,隨機產生100個輸人矢量,分別對上述兩種網絡的字母識別出錯率進行實驗,結果如圖2所示。其中縱坐標所表示的識別出錯率是將實際輸出減去期望輸出所得的輸出矩陣中所有元素的絕對值和的一半再除以26得到的;虛線代表用無噪聲的標準輸人信號訓練出網絡的出錯率,實線代表用有噪聲訓練出網絡的出錯率。從圖中可以看出,無噪聲訓練網絡對字符進行識別時,當字符一出現噪聲時,該網絡識別立刻出現錯誤;當噪聲均值超過0.02時,識別出錯率急劇上升,其最大出錯率達到21.5%。由此可見,無噪聲訓練網絡識別幾乎沒有抗干擾能力。而有噪聲訓練出的網絡具有一定的抗干擾能力,它在均值為。~0.06之間的噪聲環境下,能夠準確無誤地識別;其最大識別出錯率約為6.6%,遠遠小于無噪聲訓練出的網絡。
3.2BP網絡的設計及其識別效果
該網絡設計方法在文獻[lj中有詳細介紹。網絡具有35個輸人節點和26個輸出節點。目標誤差為0.0001,采用輸人在(0,l)范圍內對數S型激活函數兩層109519/109519網絡,隱含層根據經驗選取10個神經元。和單層感知器一樣,分別用理想輸人信號和帶有隨機噪聲的輸人訓練網絡,得到有噪聲訓練網絡和無噪聲訓練網絡。由于噪聲輸人矢量可能會導致網絡的1或o輸出不正確,或出現其他值,所以為了使網絡具有抗干擾能力,在網絡訓練后,再將其輸出經過一層競爭網絡的處理,使網絡的輸出只在本列中的最大值的位t為1,保證在其他位置輸出為O,其中網絡的訓練采用自適應學習速率加附加動量法,在MATLAB工具箱中直接調用traingdx。在與單層感知器相同的測試條件下對網絡進行性能測試,結果如圖3所示。其中虛線代表用無噪聲訓練網絡的出錯率,實線代表用有噪聲訓練網絡的出錯率。從圖中可以看出,在均值為o一0.12之間的噪聲環境下,兩個網絡都能夠準確地進行識別。在0.12~0.15之間的噪聲環境下,由于噪聲幅度相對較小,待識別字符接近于理想字符,故無噪聲訓練網絡的出錯率較有噪聲訓練網絡略低。當所加的噪聲均值超過。.15時,待識別字符在噪聲作用下不再接近于理想字符,無噪聲訓練網絡的出錯率急劇上升,此時有噪聲訓練網絡的性能較優.
轉貼于 3.3離散型,霍普菲爾德網絡的設計及其識別效果
此時網絡輸人節點數目與輸出神經元的數目是相等的,有r=s=35,采用正交化的權值設計方法。在MATLAB工具箱中可直接調用函數newh叩.m。要注意的是,由于調用函數newhoP.m,需要將輸人信號中所有的。英語論文 變換為一1。如letterA~[一1一11~1-1一11一11一l一11一11一11一1一1一11111111一l一l一111一1一1一11〕’。設計離散型霍普菲爾德網絡進行字符識別,只需要讓網絡記憶所要求的穩定平衡點,即待識別的26個英文字母。故只需要用理想輸人信號來訓練網絡。對于訓練后的網絡,我們進行性能測試。給網絡輸入任意字母,并在其上加人具有平均值從。~0.5的噪聲,隨機產生100個輸人矢量,觀察字母識別出錯率,結果如圖4所示。從圖中可以看出,在均值為0~0.33之間的噪聲環境下,網絡能夠準確地進行識別。在0.33~0.4之間的噪聲環境下,識別出錯率不到1%,在0.4以上的噪聲環境下,網絡識別出錯率急劇上升,最高達到大約10%。可以看出,該網絡穩定點的吸引域大約在0.3~。.4之間。當噪聲均值在吸引域內時,網絡進行字符識別時幾乎不出錯,而當噪聲均值超過吸引域時,網絡出錯率急劇上升。
4結論
本文設計了3種人工神經網絡對26個英文字母進行了識別。可以看出,這3種人工神經網絡均能有效地進行字符識別,并且識別速度快,自適應性能好,分辨率較高。由圖2和圖3可以看出,單層感知器的有噪聲訓練網絡在均值為O~0.06之間的噪聲環境下可以準確無誤的識別,而有噪聲訓練的BP網絡可以在o~0.12之間的噪聲環境下準確無誤的識別,故BP絡網絡容錯性比單層感知器的容錯性好;此外,噪聲達到0.2時,單層感知器的有噪聲訓練網絡的識別出錯率為6.6%,而有噪聲訓練的BP網絡的識別出錯率為2.1%,故BP網絡比單層感知器識別能力強。另外,由圖2、圖3和圖4可以看出,這3種網絡中霍普菲爾德網絡識別率最高,它在噪聲為0.33以前幾乎不會出錯,BP網絡次之,感知器最差。
通過設計、應用與性能對比,我們可得單層感知器網絡結構和算法都很簡單,訓練時間短,但識別出錯率較高,容錯性也較差。BP網絡結構和算法比單層感知器結構稍復雜,但其識別率和容錯性都較好。霍普菲爾德網絡具有設計簡單且容錯性最好的雙重優點。因此,我們應根據網絡的特點以及實際要求來選擇人工神經網絡對字符進行識別。 參考文獻
[1]叢爽.面向MATLAB工具箱的神經網絡理論與應用「M.合肥:中國科學技術大學出版社,2003.
[2]武強,童學鋒,季雋.基于人工神經網絡的數字字符識別[J].計算機工程,2003,29(14):112一113.
[3]廖翔云,許錦標,龔仕偉.車牌識別技術研究[J].徽機發展,2003,13:30一35.
[4]李中凱,王效岳,魏修亭.BP網絡在汽車牌照字符識別中的應用[J].東理工大學學報,2004,18(4):69一72.