卷積神經網絡現狀范文
時間:2024-03-28 16:38:35
導語:如何才能寫好一篇卷積神經網絡現狀,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。
篇1
1概述
深度學習(Deep Learning)是人工智能、圖像建模、模式識別、神經網絡、最優化理論和信號處理等領域的交叉學科,主要構建和模擬人腦進行分析學習,它屬于機器學習的新興領域。
2大數據與深度學習
目前,光學檢測、互聯網、用戶數據、互聯網、金融公司等許多領域都出現了海量數據,采用BP算法對于訓練神經網絡出現了梯度越來越稀疏、收斂到局部最小值只能用有標簽的數據來訓練等缺點。Hinton于2006年提出了深度學習的概念,Lecun等人提出了卷積神經網絡,卷積神經網絡利用空間關系減少參數數目以提高訓練性能。
CPU和GPU計算能力大幅提升,為深度學習提供了硬件平臺和技術手段,在海量大數據處理技術上解決了早期神經網絡訓練不足出現的過擬合、泛化能力差等問題。
大數據和深度學習必將互相支撐,推動科技發展。
3深度學習模型
深度學習模型實際上是一個包含多個隱藏層的神經網絡,目前主要有卷積神經網絡,深深度置信神經網絡,循環神經網絡。
1)卷積神經網絡
在機器學習領域,卷積神經網絡屬于前饋神經網絡的一種,神經元不再是全連接的模式,而是應用了局部感受區域的策略。然而傳統的神經網絡使用神經元間全連接的網絡結構來處理圖像任務,因此,出現了很多缺陷,導致模型⑹急劇增加,及其容易過擬合。
在卷積神經網絡中,網絡中的神經元只與前一層的部分神經元連接,利用圖像數據的空間結構,鄰近像素間具有更強的相關性,單個神經元僅對局部信息進行響應,相鄰神經元感受區域存在重疊,因此,綜合所有神經元可以得到全局信息的感知。
另外,一個卷積層中的所有神經元均由同一個卷積核對不同區域數據響應而得到,即共享同一個卷積核,使得卷積層訓練參數的數量急劇減少,提高了網絡的泛化能力。
一般在卷積層后面會進行降采樣操作,對卷積層提取的特征進行聚合統計。降采樣區域一般不存在重疊現象。降采樣簡化了卷積層的輸出信息,進一步減少了訓練參數的數量,增強了網絡的泛化能力。
卷積神經網絡實現了局部特征的自動提取,使得特征提取與模式分類同步進行,適用于處理高分辨率的圖像數據。目前,卷積神經網絡在圖像分類、自然語言處理等領域得到廣泛應用。
2)深度置信網絡
深度置信網絡是一種生成模型,網絡中有若干隱藏層,同一隱藏層內的神經元沒有連接,隱藏層間的神經元全連接。神經網絡經過“反向運行”得到輸入數據。
深度置信網絡可以用做生成模型,通過前期的逐層無監督學習,神經網絡可以較好的對輸入數據進行描述,然后把訓練好的神經網絡看作深度神經網絡,最后得到分類任務的深度神經網絡。
深度置信網絡可以用于圖像識別、圖像生成等領域,深度置信網絡可以進行無監督或半監督的學習,利用無標記數據進行預訓練,提高神經網絡性能。但近幾年由于卷積神經網絡的飛速發展,深度置信網絡已經很少被提及。
3)循環神經網絡
循環神經網絡是一種專門用于處理時序數據的神經網絡,它與典型的前饋型神經網絡最大區別在于網絡中存在環形結構,隱藏層內部的神經元是互相連接的,可以存儲網絡的內部狀態,其中包含序列輸入的歷史信息,實現了對時序動態行為的描述。這里的時序并非僅僅指代時間概念上的順序,也可以理解為序列化數據間的相對位置。如語音中的發音順序,某個英語單詞的拼寫順序等。序列化輸入的任務都可以用循環神經網絡來處理。如語音、視頻、文本等。對于序列化數據,每次處理時輸入為序列中的一個元素,比如單個字符、單詞、音節,期望輸出為該輸入在序列數據中的后續元素。循環神經網絡可以處理任意長度的序列化數據。
循環神經網絡可以用于機器翻譯、連寫字識別、語音識別等。循環神經網絡和卷積網絡結合,將卷積神經網絡用于檢測并識別圖像中的物體,循環神經網絡用于識別出物體的名稱為輸入,生成合理的語句,從而實現對圖像內容的描述。
4深度學習應用
1)語音識別
語音識別技術主要包括特征提取技術、模式匹配準則及模型訓練技術三個方面。其應用領域主要有語音輸入系統、語音控制系統和智能對話查詢系統,語音識別極大地推動了人工智能的快速發展。1952年Davis等人研究了世界上第一個能識別10個英文數字發音的實驗系統。大規模的語音識別研究是在20世紀70年代以后,在小詞匯量、孤立詞的識別方面取得了實質性的進展。2012年,微軟研究院使用深度神經網絡應用在語音識別上將識別錯誤率降低了20%,取得了突破性的進展。2015年11月17日,浪潮集團聯合全球可編程芯片巨頭Altera,以及中國最大的智能語音技術提供商科大訊飛,共同了一套DNN語音識別方案。
2)圖像分析
圖像是深度學習最早嘗試的應用領域。1989年,LeCun和他的同事們就發表了卷積神經網絡的工作。2012年10月,Hinton和他的兩個學生用更深的CNN在ImageNet挑戰上獲得了第一名,使圖像識別向前躍進了一大步。
自2012年以來,深度學習應用于圖像識別使得準確率大大上升,避免了消耗人工特征抽取的時間,極大地提升了效率,目前逐漸成為主流的圖像識別與檢測方法。
篇2
人工智能、大數據、光纖網絡等技術的發展和改進,人類社會已經進入到了“互聯網+”時代,有力的促進了信息化系統的普及和使用,比如證券交易所開發了結算交易系統,政府機關開發了電子政務系統,旅游景區開發了旅游住宿管理系統等,提高了行業智能化、自動化和共享化水平。互聯網雖然為人們帶來了極大的方便,提高了各行業的信息化水平,但是其也面臨著海量的安全攻擊威脅,比如數以萬計的病毒或木馬,都給互聯網的應用帶來了極大的障礙。目前,網絡中流行的攻擊包括病毒木馬、DDOS攻擊等,這些病毒木馬常常發生各類型的變異,比如2018年初爆發的勒索病毒,攻擊了很多政企單位的服務器,導致終端操作系統無法登錄和訪問,傳統的防火墻、殺毒軟件等網絡安全防御軟件已經無法滿足需求,需要引入大數據技術,以便能夠將被動防御技術改進為主動防御技術,及時的查處網絡中的病毒或木馬,從而可以提高互聯網防御水平。
1.網絡安全防御現狀研究
網絡安全防御經過多年的研究,已經吸引了很多的學者和企業開發先進的防御技術,比如360安全衛士、訪問控制列表、防火墻等,同時還提出了一些更加先進的深度包過濾和自治網絡等防御技術,這些技術均由許多的網絡安全防御學者、專家和企業進行研究提出,已經在網絡中部署喝應用,一定程度上提高了網絡防御水平。(1)防火墻防火墻是一種部署于因特網和局域網之間防御工具,其類似一個過濾器,可以不熟一些過濾規則,從而可以讓正常的數據通過防火墻,也可以阻止攜帶病毒或木馬的數據通過防火墻,防火墻經過多年的部署,已經誕生了數據庫防火墻、網絡防火墻、服務器防火墻等,使用枚舉規則禁止查看每一個協議是否正常,能夠防御一定的病毒或木馬。(2)殺毒軟件殺毒軟件也是一個非常關鍵的程序代碼,可以在殺毒軟件系統的服務器中保存檢測出的病毒或木馬基因特征片段,將這些片段可以與網絡中的數據信息進行匹配,從而可以查找網絡中的病毒或木馬,及時的將其從網絡中清除。殺毒軟件為了能夠準確的識別病毒,目前引入了許多的先進技術,這些技術包括脫殼技術、自我保護技術等,同時目前也吸引了更多的網絡安全防御公司研究殺毒軟件,最為著名的軟件廠商包括360、瑞星、江民、卡巴斯基等,同時騰訊公司、搜狗公司也開發了自己的安全管理技術,大大的提高網絡防御能力。(3)訪問控制列表訪問控制列表是一個易于配置、安裝簡單和管理容易的網絡安全防御工具,設置了黑白兩個關鍵名單,白名單收錄了安全數據源IP地址,黑名單收錄了非法的數據源IP地址。訪問控制列表已經可以在四個層次配置防御策略,分別是目錄及控制級、入網訪問控制級、屬性控制級和權限控制級。訪問控制列表級別越高訪問性能越好,但是工作效率非常慢,不能夠實時升級訪問控制列表,因此應用的場所比較簡單,一般都是不重要的中小學實驗室等,許多大型政企單位都不用這個防御措施。(4)深度包過濾深度包過濾能夠嵌入到硬件中形成一個固件,這樣就可以快速的采集網絡中的數據,然后利用深度包過濾的枚舉檢查規則,不僅檢查數據包的頭部IP地址、目的IP地址,還檢查數據包中的內容,以便能夠深入到數據包內部檢查是否存在病毒或木馬,一旦發現就可以啟動防御軟件。深度包過濾可以實施穿透式檢查規則,分析每一個協議字段,深入到內部檢查的更加詳細和全面,從而避免病毒或木馬隱藏在數據包內部,因此深度包過濾已經在很多領域得到應用,比如阿里云、騰訊云、百度云等都采用了這些技術,許多的政企單位也采用了深度包過濾技術,進一步提高了數據防御水平。(5)自治網絡自治網絡作為一種先進的互聯網安全防御技術,其采用了自動愈合的建設理念,在網絡中構建了一個冗余策略,一旦網絡受到病毒或木馬的攻擊,此時自治網絡就可以將這些一部分網絡設備隔離,同時形成一個新傳輸通道為網絡設備提供連接,知道數據修復完畢之后才能夠將這些網絡拓撲結構納入到網絡中。自治網絡可以實現自我防御,也可以調動網絡信息安全的許多的資源,將網絡病毒導入備用服務器,此時就可以殺滅這些病毒。
2.基于大數據的網絡安全防御系統設計
網絡安全防御系統集成了很多先進的技術,尤其是快速的數據采集和大數據分析技術,能夠將傳統的被動網絡安全防御模式轉變為主動,提高網絡安全防御性能。本文結合傳統的網絡安全防御功能及引入的大數據技術,給出了網絡安全防御系統的主要功能,這些功能包括四個關鍵方面,分別是數據采集功能、大數據圖1基于大數據的網絡安全防御系統功能分析功能、網絡安全防御功能和防御效果評估功能。(1)網絡數據采集功能目前,人們已經進入到了“互聯網+”時代,網絡部署的軟硬件資源非常多,訪問的用戶頻次數以億計,因此網絡安全防御首先需要構建一個強大的數據采集功能,可以及時的采集網絡中的軟硬件數據資源,將這些網絡數據發送給大數據分析功能。網絡數據采集過程中可以引入深度包過濾功能,利用這個深度包過濾可以快速的采集網絡數據,提高網絡數據采集速度。(2)大數據分析和處理功能網絡數據采集完畢之后,系統將數據發送給大數據分析和處理模塊,該模塊中包含了很多的病毒基因片段或特征,可以針對網絡數據進行智能分析,將預處理后的網絡數據與學習到的特征進行對比,以便能夠發現這些數據信息中是否潛藏著木馬或病毒,發現之后及時的將其發送給安全防御模塊。(3)網絡安全防御功能網絡安全防御與傳統的防御技術一致,采用木馬或病毒查殺軟件,因此一旦發現網絡中存在病毒或木馬,此時就可以啟動網絡安全防御工具,及時的將網絡中的病毒或木馬殺滅,并且可以跟蹤病毒或木馬來源,從而可以鎖定源頭服務器,將源頭清除掉。如果源頭涉及到犯罪就可以獲取這些證據,同時將這些證據發送給公安機關進行偵破。(4)防御效果評估功能網絡安全防御功能完成之后,系統可以針對處理效果進行評估,從而可以獲取網絡系統中的殺毒信息,將這些網絡病毒消滅,避免網絡中的病毒或木馬復發。網絡安全防御效果評估之后,還可以跟蹤大數據分析的準確度,一旦準確度降低就可以及時進行學習,從而提高網絡安全防御性能。大數據是一種非常關鍵的數據處理和分析技術,可以利用多種算法,比如BP神經網絡算法、支持向量機、深度學習、K-means算法等挖掘數據中潛在的知識,這些知識對人們是有價值的,能夠幫助人們進行決策。本文為了能夠更好的展示互聯網應用性能,重點描述了深度學習算法分析互聯網安全數據過程。深度學習算法是一種多層次的卷積神經網絡,包括兩個非常關鍵的層次結構,一個是卷積層稱為病毒數據特征提取層,一個卷積層為病毒數據特征映射層,可以識別病毒數據中的特征數據,同時將池化層進行處理,壓縮和處理池化層數據信息,比如進行預處理、二值化等,刪除病毒數據中的一些明顯的噪聲特征。池化層可以將海量的病毒數據進行壓縮,減少卷積神經網絡分析時設置的參數,解決卷積神經網絡學習和訓練時容易產生的過度擬合問題,避免病毒識別模型陷入到一個過度擬合狀態,避免無法提高病毒識別能力,還會提升病毒識別處理開銷。全連接層就是一個關鍵分類器,可以將學習到的病毒知識標記到一個特征空間,這樣就可以提高病毒識別結果的可解釋性。卷積神經網絡通過學習和訓練之后,其可以形成一個動態優化的網絡結構,這個結構可以在一定時期內保持不變,能夠實現病毒特征的識別、分析,為病毒識別提供一個準確的結果。
篇3
關鍵詞人臉識別;特征提取
1人臉識別技術概述
近年來,隨著計算機技術的迅速發展,人臉自動識別技術得到廣泛研究與開發,人臉識別成為近30年里模式識別和圖像處理中最熱門的研究主題之一。人臉識別的目的是從人臉圖像中抽取人的個性化特征,并以此來識別人的身份。一個簡單的自動人臉識別系統,包括以下4個方面的內容:
(1)人臉檢測(Detection):即從各種不同的場景中檢測出人臉的存在并確定其位置。
(2)人臉的規范化(Normalization):校正人臉在尺度、光照和旋轉等方面的變化。
(3)人臉表征(FaceRepresentation):采取某種方式表示檢測出人臉和數據庫中的已知人臉。
(4)人臉識別(Recognition):將待識別的人臉與數據庫中的已知人臉比較,得出相關信息。
2人臉識別算法的框架
人臉識別算法描述屬于典型的模式識別問題,主要有在線匹配和離線學習兩個過程組成,如圖1所示。
圖1一般人臉識別算法框架
在人臉識別中,特征的分類能力、算法復雜度和可實現性是確定特征提取法需要考慮的因素。所提取特征對最終分類結果有著決定性的影響。分類器所能實現的分辨率上限就是各類特征間最大可區分度。因此,人臉識別的實現需要綜合考慮特征選擇、特征提取和分類器設計。
3人臉識別的發展歷史及分類
人臉識別的研究已經有相當長的歷史,它的發展大致可以分為四個階段:
第一階段:人類最早的研究工作至少可追朔到二十世紀五十年代在心理學方面的研究和六十年代在工程學方面的研究。
J.S.Bruner于1954年寫下了關于心理學的Theperceptionofpeople,Bledsoe在1964年就工程學寫了FacialRecognitionProjectReport,國外有許多學校在研究人臉識別技術[1],其中有從感知和心理學角度探索人類識別人臉機理的,如美國TexasatDallas大學的Abdi和Tool小組[2、3],由Stirling大學的Bruce教授和Glasgow大學的Burton教授合作領導的小組等[3];也有從視覺機理角度進行研究的,如英國的Graw小組[4、5]和荷蘭Groningen大學的Petkov小組[6]等。
第二階段:關于人臉的機器識別研究開始于二十世紀七十年代。
Allen和Parke為代表,主要研究人臉識別所需要的面部特征。研究者用計算機實現了較高質量的人臉灰度圖模型。這一階段工作的特點是識別過程全部依賴于操作人員,不是一種可以完成自動識別的系統。
第三階段:人機交互式識別階段。
Harmon和Lesk用幾何特征參數來表示人臉正面圖像。他們采用多維特征矢量表示人臉面部特征,并設計了基于這一特征表示法的識別系統。Kaya和Kobayashi則采用了統計識別方法,用歐氏距離來表征人臉特征。但這類方法需要利用操作員的某些先驗知識,仍然擺脫不了人的干預。
第四階段:20世紀90年代以來,隨著高性能計算機的出現,人臉識別方法有了重大突破,才進入了真正的機器自動識別階段。在用靜態圖像或視頻圖像做人臉識別的領域中,國際上形成了以下幾類主要的人臉識別方法:
1)基于幾何特征的人臉識別方法
基于幾何特征的方法是早期的人臉識別方法之一[7]。常采用的幾何特征有人臉的五官如眼睛、鼻子、嘴巴等的局部形狀特征。臉型特征以及五官在臉上分布的幾何特征。提取特征時往往要用到人臉結構的一些先驗知識。識別所采用的幾何特征是以人臉器官的形狀和幾何關系為基礎的特征矢量,本質上是特征矢量之間的匹配,其分量通常包括人臉指定兩點間的歐式距離、曲率、角度等。
基于幾何特征的識別方法比較簡單、容易理解,但沒有形成統一的特征提取標準;從圖像中抽取穩定的特征較困難,特別是特征受到遮擋時;對較大的表情變化或姿態變化的魯棒性較差。
2)基于相關匹配的方法
基于相關匹配的方法包括模板匹配法和等強度線方法。
①模板匹配法:Poggio和Brunelli[10]專門比較了基于幾何特征的人臉識別方法和基于模板匹配的人臉識別方法,并得出結論:基于幾何特征的人臉識別方法具有識別速度快和內存要求小的優點,但在識別率上模板匹配要優于基于幾何特征的識別方法。
②等強度線法:等強度線利用灰度圖像的多級灰度值的等強度線作為特征進行兩幅人臉圖像的匹配識別。等強度曲線反映了人臉的凸凹信息。這些等強度線法必須在背景與頭發均為黑色,表面光照均勻的前提下才能求出符合人臉真實形狀的等強度線。
3)基于子空間方法
常用的線性子空間方法有:本征子空間、區別子空間、獨立分量子空間等。此外,還有局部特征分析法、因子分析法等。這些方法也分別被擴展到混合線性子空間和非線性子空間。
Turk等[11]采用本征臉(Eigenfaces)方法實現人臉識別。由于每個本征矢量的圖像形式類似于人臉,所以稱本征臉。對原始圖像和重構圖像的差分圖像再次進行K-L變換,得到二階本征空間,又稱二階本征臉[12]。Pentland等[13]提出對于眼、鼻和嘴等特征分別建立一個本征子空間,并聯合本征臉子空間的方法獲得了好的識別結果。Shan等[14]采用特定人的本征空間法獲得了好于本征臉方法的識別結果。Albert等[15]提出了TPCA(TopologicalPCA)方法,識別率有所提高。Penev等[16]提出的局部特征分析(LFALocalFeatureAnalysis)法的識別效果好于本征臉方法。當每個人有多個樣本圖像時,本征空間法沒有考慮樣本類別間的信息,因此,基于線性區別分析(LDALinearDiscriminantAnalysis),Belhumeur等[17]提出了Fisherfaces方法,獲得了較好的識別結果。Bartlett等[18]采用獨立分量分析(ICA,IndependentComponentAnalysis)的方法識別人臉,獲得了比PCA方法更好的識別效果。
4)基于統計的識別方法
該類方法包括有:KL算法、奇異值分解(SVD)、隱馬爾可夫(HMM)法。
①KL變換:將人臉圖像按行(列)展開所形成的一個高維向量看作是一種隨機向量,因此采用K-L變換獲得其正交K-L基底,對應其中較大特征值基底具有與人臉相似的形狀。國外,在用靜態圖像或視頻圖像做人臉識別的領域中,比較有影響的有MIT的Media實驗室的Pentland小組,他們主要是用基于KL變換的本征空間的特征提取法,名為“本征臉(Eigenface)[19]。
②隱馬爾可夫模型:劍橋大學的Samaria和Fallside[20]對多個樣本圖像的空間序列訓練出一個HMM模型,它的參數就是特征值;基于人臉從上到下、從左到右的結構特征;Samatia等[21]首先將1-DHMM和2-DPseudoHMM用于人臉識別。Kohir等[22]采用低頻DCT系數作為觀察矢量獲得了好的識別效果,如圖2(a)所示。Eickeler等[23]采用2-DPseudoHMM識別DCT壓縮的JPEG圖像中的人臉圖像;Nefian等采用嵌入式HMM識別人臉[24],如圖2(b)所示。后來集成coupledHMM和HMM通過對超狀態和各嵌入狀態采用不同的模型構成混合系統結構[25]。
基于HMM的人臉識別方法具有以下優點:第一,能夠允許人臉有表情變化,較大的頭部轉動;第二,擴容性好.即增加新樣本不需要對所有的樣本進行訓練;第三,較高的識別率。
(a)(b)
圖2(a)人臉圖像的1-DHMM(b)嵌入式隱馬爾科夫模型
5)基于神經網絡的方法
Gutta等[26]提出了混合神經網絡、Lawrence等[27]通過一個多級的SOM實現樣本的聚類,將卷積神經網絡CNN用于人臉識別、Lin等[28]采用基于概率決策的神經網絡方法、Demers等[29]提出采用主元神經網絡方法提取人臉圖像特征,用自相關神經網絡進一步壓縮特征,最后采用一個MLP來實現人臉識別。Er等[30]采用PCA進行維數壓縮,再用LDA抽取特征,然后基于RBF進行人臉識別。Haddadnia等[31]基于PZMI特征,并采用混合學習算法的RBF神經網絡進行人臉識別。神經網絡的優勢是通過學習的過程獲得對這些規律和規則的隱性表達,它的適應性較強。
6)彈性圖匹配方法
Lades等提出采用動態鏈接結構(DLA,DynamicLinkArchitecture)[32]的方法識別人臉。它將人臉用格狀的稀疏圖如圖3所示。
圖3人臉識別的彈性匹配方法
圖3中的節點用圖像位置的Gabor小波分解得到的特征向量標記,圖的邊用連接節點的距離向量標記。Wiskott等人使用彈性圖匹配方法,準確率達到97.3%。Wiskott等[33]將人臉特征上的一些點作為基準點,構成彈性圖。采用每個基準點存儲一串具有代表性的特征矢量,減少了系統的存儲量。Wurtz等[34]只使用人臉ICI部的特征,進一步消除了結構中的冗余信息和背景信息,并使用一個多層的分級結構。Grudin等[35]也采用分級結構的彈性圖,通過去除了一些冗余節點,形成稀疏的人臉描述結構。另一種方法是,Nastar等[36]提出將人臉圖像I(x,y)表示為可變形的3D網格表(x,y,I(x,y)),將人臉匹配問題轉換為曲面匹配問題,利用有限分析的方法進行曲面變形,根據兩幅圖像之間變形匹配的程度識別人臉。
7)幾種混合方法的有效性
(1)K-L投影和奇異值分解(SVD)相融合的分類判別方法。
K-L變換的核心過程是計算特征值和特征向量。而圖像的奇異值具有良好的穩定性,當圖像有小的擾動時,奇異值的變化不大。奇異值表示了圖像的代數特征,在某種程度上,SVD特征同時擁有代數與幾何兩方面的不變性。利用K-L投影后的主分量特征向量與SVD特征向量對人臉進行識別,提高識別的準確性[37]。
(2)HMM和奇異值分解相融合的分類判別方法。
采用奇異值分解方法進行特征提取,一般是把一幅圖像(長為H)看成一個N×M的矩陣,求取其奇異值作為人臉識別的特征。在這里我們采用采樣窗對同一幅圖片進行重疊采樣(如圖4),對采樣所得到的矩陣分別求其對應的前k個最大的奇異值,分別對每一組奇異值進行矢量標準化和矢量重新排序,把這些處理后的奇異值按采樣順序組成一組向量,這組向量是惟一的[38]。
圖4采樣窗采樣
綜合上述論文中的實驗數據表明[39],如表1:
表1人臉識別算法比較
8)基于三維模型的方法
該類方法一般先在圖像上檢測出與通用模型頂點對應的特征點,然后根據特征點調節通用模型,最后通過紋理映射得到特定人臉的3D模型。Tibbalds[40]基于結構光源和立體視覺理論,通過攝像機獲取立體圖像,根據圖像特征點之間匹配構造人臉的三維表面,如圖5所示。
圖5三維人臉表面模型圖6合成的不同姿態和光照條件下二維人臉表面模型
Zhao[41]提出了一個新的SSFS(SymetricShape-from-Shading)理論來處理像人臉這類對稱對象的識別問題,基于SSFS理論和一個一般的三維人臉模型來解決光照變化問題,通過基于SFS的視圖合成技術解決人臉姿態問題,針對不同姿態和光照條件合成的三維人臉模型如圖6所示。
三維圖像有三種建模方法:基于圖像特征的方法[42、43]、基于幾何[44]、基于模型可變參數的方法[45]。其中,基于模型可變參數的方法與基于圖像特征的方法的最大區別在于:后者在人臉姿態每變化一次后,需要重新搜索特征點的坐標,而前者只需調整3D變形模型的參數。三維重建的系統框圖,如圖7所示。
圖7三維建模的系統框圖
三維人臉建模、待識別人臉的姿態估計和識別匹配算法的選取是實現三維人臉識別的關鍵技術。隨著采用三維圖像識別人臉技術的發展,利用直線的三維圖像信息進行人臉識別已經成為人們研究的重心。
4總結與展望
人臉自動識別技術已取得了巨大的成就,隨著科技的發展,在實際應用中仍然面臨困難,不僅要達到準確、快速的檢測并分割出人臉部分,而且要有效的變化補償、特征描述、準確的分類的效果,還需要注重和提高以下幾個方面:
(1)人臉的局部和整體信息的相互結合能有效地描述人臉的特征,基于混合模型的方法值得進一步深入研究,以便能準確描述復雜的人臉模式分布。
(2)多特征融合和多分類器融合的方法也是改善識別性能的一個手段。
(3)由于人臉為非剛體性,人臉之間的相似性以及各種變化因素的影響,準確的人臉識別仍較困難。為了滿足自動人臉識別技術具有實時要求,在必要時需要研究人臉與指紋、虹膜、語音等識別技術的融合方法。
(4)3D形變模型可以處理多種變化因素,具有很好的發展前景。已有研究也表明,對各種變化因素采用模擬或補償的方法具有較好的效果。三維人臉識別算法的選取還處于探索階段,需要在原有傳統識別算法的基礎上改進和創新。
(5)表面紋理識別算法是一種最新的算法[52],有待于我們繼續學習和研究出更好的方法。
總之,人臉識別是極富挑戰性的課題僅僅采用一種現有方法難以取得良好的識別效果,如何與其它技術相結合,如何提高識別率和識別速度、減少計算量、提高魯棒性,如何采用嵌入式及硬件實現,如何實用化都是將來值得研究的。
參考文獻
[1]O''''TooleAJ,AbdiH,DeffenbacherKA,etal.Alowdimensionalrepresentationoffacesinthehigherdimensionsofspace.[J].JournaloftheOpticalSocietyof2America,1993,10:405~411
[2]張翠萍,蘇光大.人臉識別技術綜述.中國圖像圖形學報,2000,5(11):885-894
[3]A.Samal,P.A.Iyengar.Automaticrecognitionandanalysisofhumanfacesandfacialexpressions:asurvey[J].PatternRecognition,1992,25(1):65-67
[4]TurkM,PentlandA.Eigenfacesforrecognition[J].JournalofCognitiveNeuroscience,1991,3(1):71~86
[5]BartlettMS,MovellanJR,SejnowskiTJ.FaceRecognitionbyIndependentComponentAnalysis[J].IEEETrans.onNeuralNetwork,2002,13(6):1450-1464
[6]ManjunathBS,ShekharCandChellappaR.Anewapproachtoimagefeaturedetectionwithapplication[J].Patt.Recog,1996,29(4):627-640
[7]ChengY.LiuK,YangJ,etal.Humanfacerecognitionmethodbasedonthestatisticalmodelofsmallsamplesize.SPIEProc,Intell.RobotsandComputerVisionX:AlgorithmsandTechn.1991,1606:85-95
[8]NefianAVEmbeddedBayesianNetworksforFaceRecognition[A].Proceedings.IEEEInternationalConferenceonMultimediaandExpo[C]2002,2:133-136
[9]GuttaS,WechslerH.FaceRecognitionUsingHybridClassifiers[J].PatternRecognition,1997,30(4):539-553
[10]HaddadniaJ,AhmadiM,FaezKAHybridLearningRBFNeuralNetworkforHumanFaceRecognitionwithPseudoZernikeMomentInvariant[A].Proceedingsofthe2002InternationalJointConferenceonNeuralNetworks[C].2002,1:11-16
[11]M.Lades,J.C.Vorbruggen,J.Buhmann,ect.Distortioninvariantobjectrecognitioninthedynamiclinkarchitecture.IEEETrans.onComputer,1993,42(3):300-311
[12]NastarC,MoghaddamBA.FlexibleImages:MatchingandRecognitionUsingLearnedDeformations[J].ComputerVisionandImageUnderstanding,1997,65(2):179-191
[13]羊牧.基于KL投影和奇異值分解相融合人臉識別方法的研究[D].四川大學.2004,5,1
[14]白冬輝.人臉識別技術的研究與應用[D].北方工業大學.2006,5
篇4
論文摘要: 當點擴展函數未知或不確知的情況下, 從觀察到的退化圖像中恢復原始圖像的過程稱為圖像盲復原。近年來, 圖像盲復原算法得到了廣泛的研究。本文在介紹了盲圖像恢復算法的現狀的基礎上進一步研究其的發展方向。
一、引言
圖像恢復是圖像處理中的一大領域,有著廣泛的應用,正成為當前研究的熱點。圖像恢復的主要目的是使退化圖像經過一定的加工處理,去掉退化因素,以最大的保真度恢復成原來的圖像。傳統的圖像恢復假設圖像的降質模型是己知的。而許多情況下,圖像的降質模型未知或具有較少的先驗知識,必須進行所謂的盲恢復。其重要性和艱巨性而成為一個研究熱點。目前所能獲取的觀測圖像是真實圖像經過觀測系統成像的結果。由于觀測系統本身物理特性的限制,同時受觀測環境的影響,觀測圖像和真實圖像之間不可避免地存在著偏差和失真,稱觀測系統對真實圖像產生了降質。圖像恢復的目的就是根據降質的觀測圖像分析和計算得出真實圖像。
二、圖像盲恢復算法的現狀
總體來說, 圖像盲復原方法主要分為以下兩類: 一是首先利用真實圖像的特別特征估計PSF,然后借助估計得到的PSF,采用經典的圖像復原方法進行圖像的復原。這類方法將PSF的估計與圖像的復原過程分為2個不同的過程,因而具有較少計算量的特點;二是PSF辨識和真實圖像估計相結合,同時辨識PSF和真實圖像。這類算法較為復雜,計算量較大。另外,對于點擴展函數也考慮了空間變化的復雜情況。針對目前的盲復原算法的現狀,根據退化模型的特點, 重新將算法分為空間不變的單通道盲復原算法、空間不變多通道盲復原算法和空間變化圖像盲復原算法3類。
(一)單通道空間不變圖像盲復原算法
在這類算法中, 最為常用的是參數法和迭代法。
1)參數法。所謂參數法, 即模型參數法, 就是將PSF和真實圖像用某一類模型加以描述, 但模型的參數需要進行辨識。在參數法中, 典型的有先驗模糊辨識法和ARMA 參數估計法, 前者先辨識PSF的模型參數,后辨識真實圖像, 屬于第1 種類型的圖像盲復原算法, 因而計算量較小;后者同時辨識PSF和真實圖像模型參數, 屬于第2種類型圖像盲復原算法。
2)迭代法。所謂的迭代法, 不是通過建立模型而是通過算法的迭代過程, 加上有關真實圖像和PSF的約束來同時辨識PSF和真實圖像的方法。迭代法是單通道
圖像盲復原算法中應用最廣泛的一類算法, 它不需建立模型, 也不要求PSF 為最小相位系統, 因而跟實際更為接近。在這類算法中, 迭代盲復原算法(IBD), 基于非負性和決策域的遞歸逆濾波器算法(NAR2R IF) ,基于高階統計特性的最小
熵算法等最為典型。
(二)多通道二維圖像盲復原
多通道二維圖像盲復原, 這類方法將數字通訊領域應用的一維多通道盲原分離算法擴展到二維情況并用于圖像的盲恢復。這類算法中有兩種代數方法, 一種是先辨識模糊函數, 再采用常規的恢復算法進行復原;另一種是直接對逆濾波器進行估計。此類算法的優點在于不需對初始圖像進行估計, 也不存在穩定性和收斂性問題,對圖像以及模糊函數的約束是松弛的,算法具有一般性。但是第1種算法要求采用復原算法具有收斂性;第2種算法對噪聲敏感。
(三)空間改變的圖像盲復原方法
在許多實際的應用中, 模糊往往是空間變化的,但由于處理工作的難度, 目前的研究較少,基本有相關轉換恢復和直接法兩類。
相關轉換恢復的基本思想是區域分割, 即將整幅圖像分為若干局部區域, 然后假設在各個局部區域模糊是空間不變的, 利用空間不變的圖像復原有關算法進行復原。這類方法都是基于窗口的模糊辨識技術, 圖像的估計取決于窗口的大小, 由于模糊參數是連續變化的, 在范圍較大時空間不變的假設是不成立的, 因而模糊的估計精度較差, 而且這種方法只能針對部分空間變化的模糊進行處理, 缺乏通用性; 其次在區域的邊上存在振鈴現象。
直接法的基本思想是直接對圖像進行處理。如采用簡化的二維遞推卡爾曼濾波器進行圖像模型和模糊模型的直接轉換方法, 其缺點是只能針對有限的模型, 而且模型數增加, 計算量會顯著增大;采用共軛梯度迭代算法, 但只見到一個31×31 的文本圖像處理的結果報道,對于大圖像處理效果尚需進一步的研究;將空間變化圖像系統建立成馬爾苛夫隨機模型,對復原過程,采用模擬退火算法進行最大后驗估計的方法,這種方法避免了圖像的窗口化, 并能克服模糊參數不連續性造成的影響,但這種方法只能局限于將模糊過程建立成單參數的馬爾苛夫隨機模型的情況,而且計算量也較大。
三、圖像盲恢復的應用前景
(1)現有算法的改進以及新的算法研究?,F有各種算法還存在許多不足,有必要對算法進一步改進。如IBD算法中, 如何選擇初始條件才能保證算法的收斂;如何選擇算法終止條件才能保證恢復的質量; 如何選擇濾波器中的噪聲參數才能減少噪聲的影響。又如NAR2R IF算法中, 如何進一步解決噪聲敏感問題,支持域的確定以及如何將算法擴展到非均勻背景的情況等。提出新的算法更好地解決圖像盲復原問題, 也是今后研究的熱點。
(2)基于非線性退化模型的圖像盲復原算法。在實際應用中,嚴格來講,所有的退化模型都是非線性的。對模型采用線性化的方法進行近似處理,雖然算法簡單,但對非線性嚴重的情況處理效果并不理想?;诙囗検揭约吧窠浘W絡兩種參數模型處理非線性信號盲分離算法,算法擴展到二維圖像情況需要進一步研究。研究基于非線性退化模型的圖像盲復原算法也是下一步研究方向之一。
(3)去噪處理算法研究。加性噪聲的存在,使圖像的復原問題變成了一個病態問題,而且由于一般假設只知道噪聲的統計特性,因此要從退化圖像中完全去除噪聲是不可能的。另外,由于噪聲的存在,恢復的效果并不理想,結合降噪的圖像盲恢復的算法研究有很現實的意義,這方面也進行了部分工作。為克服噪聲的影響,一般采用先進行降噪,后進行復原;二是將降噪和復原同時進行這兩類方法。目前,大多數算法中將噪聲描述成高斯噪聲進行研究, 在實際應用時有較大局限性。對于非高斯情況的研究采用基于噪聲的高階統計特性的去噪算法研究也是很重要的研究方向,也可采用其他類型的方法進行降噪,利用自組織映射的非線性獨立組件分析方法進行圖像降噪處理算法。
(4)實時處理算法。算法的的復雜性是制約算法應用的一個重要方面??刹捎谜齽t化的離散周期Radon變換的方法將二維的卷積轉化為一維進行處理,以提高算法的速度;也可采用神經網絡的實時處理算法。算法的實時性是算法實際應用的先決條件。
(5)應用研究。算法的應用是推動算法研究的動力。雖然圖像盲復原算法在天文學、醫學、遙感等方面獲得了較大的應用, 但將算法應用到一般的工業圖像實時檢測、機器視覺、網絡環境下的圖像傳輸恢復、刑事偵破等方面還有大量的工作要做。
參考文獻:
[1] 薛梅,楊綠溪.用于含噪二值圖像的改進NAS-RIF圖像盲復原算[J].數據處理.2006.17.(2).
篇5
關鍵詞:大學計算機基礎;教學改革;人工智能;智慧課堂
云計算、大數據、人工智能新興領域的崛起,推動信息技術全面滲透于人們的生產生活中。信息技術的核心在于計算機技術和通信技術。然而,雖然目前各個高校都開設了計算機基礎課程,但是其教學卻存在著諸多問題,導致該課程無法達到預期的教學效果。教育部在2012年《教育信息化十年發展規劃(2011-2020年)》,其中指明“以教育信息化帶動教育現代化,促進教育的創新與變革”[2]。因此,本文以華中師范大學計算機基礎課程教學為例,深入闡述了傳統計算機基礎課程教學的弊端,提出了在當前人工智能如火如荼的時代背景下,如何應用人工智能相關技術對傳統的計算機基礎教學進行改革的具體方案。該方案以創建網絡智慧課堂教學模式改革為主體,輔以教學觀念、知識體系和課程考核方式改革,以期對高校的計算機基礎課程教學有所裨益。
1傳統教學的缺陷
⑴課程的教學地位沒有引起足夠的重視一些高校為計算機基礎課程分配較少的學時(少于48學時),甚至有的專業將此課程設置為選修課。這種設置降低了該課程在教師和學生心目中的位置,導致了對該課程的忽視。同時,不少老師因為學時不夠,時間緊迫,僅僅講述與考試相關的內容,不考的一概不講。這導致學生的眼界受限,知識和能力受限,無法培養其全面綜合的計算機素質。還有的專業沒有將這門課給專業的計算機學院的老師講授,而是隨意安排授課人員。沒有經過系統專業訓練的教師缺乏足夠的知識儲備,很難講好這一門看似簡單的課程。⑵課程教學內容的制定與當今時代對于信息化人才的需求脫節一些高校的現狀是計算機基礎的課程教材知識陳舊[3]、質量堪憂,教材總是無法跟上知識更新的步伐,例如都2019年了還在講Office2010。有的高校由于缺乏對課程的重視,沒有對教材優中選優,而是基于利益的考慮,優先選擇自己院系編寫的教材。其教材內容是七拼八湊,沒有整體性、邏輯性和連貫性,更不用說前瞻性。這樣的教材,無疑對學生的學習設置了巨大的屏障。除此以外,一些院校的課程教學知識體系不夠明確和完善,教學大綱的制定不夠科學。從教學大綱中制定的學時分配來說,常常偏重實用性[4],常用計算機軟件操作占據了大部分的課時。這會讓教師在授課時輕理論而重操作,如此培養學生,非常不利于其計算思維的形成,對后續其他計算機相關課程的學習也是很大的傷害。⑶教學模式過于傳統,信息化水平較低從教學方式上來說,傳統的教學模式以教師課堂授課為中心,是以教師為主體的教學模式[5]。在這種模式下,教師仍然主要以填鴨式教學為主[6],無法通過課堂教學發現學生的個性化特點,并進行有針對性的教學。另外,雖然計算機基礎課程一般都配備了實驗課時,但是實驗課常常是采用教師布置上機任務、學生做完抽樣檢查的模式。這對于大課堂來說,教師的任務繁重,無法搜集到每一個學生的任務完成情況,無法清晰地掌握學生學習的實際情況和薄弱環節。而且,該課程缺乏相應的研討課時,很難讓學生對其所學知識進行深入思考和探究,以增強思辨能力和對課程的學習興趣。⑷課程考核方式不夠公平合理從考核方式上來說,該課程普遍采用“平時成績”+“期末考試”的加權方式對學生成績進行評定。平時成績多由考勤分所得,期末考試多采用機考模式。這種考核方式過于單一化、機械化,無法對學生進行全方位的評價。很多學生來到教室打考勤,但可能根本沒聽講,而是在睡覺或者玩手機。期末機考的公平合理性也是存在著很多的漏洞。例如機考的試題庫可以十年不變,分值的分配和難度的掌握都沒有經過系統的考量。甚至有的考試系統不夠穩定和安全,頻頻爆出Bug,嚴重影響了考試結果的真實性。
2新人工智能環境下對計算機基礎課程改革的具體方案
2012年開始,在隨著卷積神經網絡技術在視覺處理方面的應用取得巨大的成功之后,人工智能到達了有史以來的第三個爆發期。目前,深度學習技術在AlphaGo、無人駕駛汽車、機器翻譯、智能助理、機器人、推薦系統等領域的發展如火如荼。與此同時,人工智能技術在教育領域方面的應用已經興起。人工智能的教學產品也已有先例,例如基于MOOC平臺研發的教學機器人MOOCBuddy等等?;谌斯ぶ悄艿慕逃侨诤显朴嬎恪⑽锫摼W、大數據、VR、區塊鏈等新興技術的增強型數字教育[2].在當前人工智能的大時代背景下,針對傳統計算機基礎的種種弊端,我們提出了如下教學改革方案。⑴改變教學理念,確立計算機基礎課程的重要地位計算機基礎作為高校的一門公共課,實則應當作為各個專業的學生后續的學習、科研的必修之課程。因此,高等學校應從源頭上確立該課程的重要地位,將該課程納入必修課范疇,并給與更充分合理的課時分配。除教學課時、實驗課時之外,需要為該課程增加一定的研討課時。任課老師必須是來自于計算機專業的人才。同時,定時舉辦關于該課程的教學培訓、教學研討會和教學比賽,改變教師的教學理念,從源頭上給予該課程足夠的重視。⑵優化教學內容,重新制定課程的教學知識體系教材是教師教學的主要依據,也是學生獲得系統性知識的主要來源。因此,教材對于教學的重要性不言而喻。教材的選取需要優中擇優,必要的時候可以根據自身院校的情況自己編寫,力求使用好的教材使教學事半功倍。在選定優質教材的基礎上,制定更加合理的教學大綱,優化計算機基礎課程的教學知識體系,突出計算機學科入門相關基礎理論知識的重要地位。對現有的過時內容進行更新,例如操作系統以Windows10的操作取代Windows7,Office這部分使用Office2019版本取代2010的版本,同時增加關于算法入門知識、程序設計入門知識以及人工智能、區塊鏈等前沿知識單元的介紹。以華中師范大學為例,我們在圖1中給出了該校計算機基礎課程的教學知識體系結構圖。⑶充分利用現代化的教學工具和人工智能技術,構建智慧課堂,改變傳統教學模式現代化的教學應當轉變以教師為核心的教學模式,更加突出學生的主體性地位。因此,在人工智能、物聯網、大數據等技術和蓬勃發展的情形下,應當改變傳統的課堂教學形式,充分利用現代化信息技術,將傳統課堂教學和網絡課堂教學模式相結合,構建智慧課堂。融合課堂教學身臨其境的效果與網絡課堂自主性強且方便師生交流的特點,通過師生之間多層次、立體化的互動,達到提升教學效果的目的。同時,建立功能強大、完善的學生實驗平臺,基于不同專業學生的不同特點和不同需求,進行個性化的作業設置。針對教師布置的實驗任務和學生的完成情況,結合在線網絡教學系統,通過傳感器及網絡數據,搜集學生的學習行為數據,并且使用人工智能算法進行智能分析,使教師對當前的學生的學習情況一目了然,并能引導學生對重點、難點的鞏固和掌握。研討課以學生為主體,按照所選課題進行分組調研、分組討論,刺激學生的學習興趣,培養其思辨能力。研討內容最終可以課程論文的形式上交至課程共享平臺,由教師和同學共同給出評分。這里,仍以華中師范大學為例,我們將在線教學系統、實驗課平臺、研討課共享平臺等集成為一個基于人工智能技術的網絡智慧教學綜合平臺系統。該系統主要包括用戶管理、在線教學、課堂互動、作業管理、考試管理、BBS系統、智能分析和平臺管理8個模塊,其主要功能如圖2所示。該系統采用C/S模式,系統的服務器選用Linux服務器,同時開發基于PC機的和手機端的客戶端系統,方便學生和教師隨時選用、更加靈活。在線教學模塊中的智能學習助理功能,能夠根據歷史用戶的學習行為和當前用戶的學習行為,自動地識別學習內容中的難點以及當前學生的難點內容,有針對性地對學生進行知識點強化。課堂互動模塊中,通過可穿戴式傳感器搜集學生的學習行為,用于后續智能分析模塊中對學生的學習態度和學習行為進行智能分析。在線作業評價模塊包括機器評價和教師評價兩個功能。機器評價是系統為學生作業(客觀題、主觀題)自動評分,其中主觀題的評分也是使用人工智能技術來實現。教師評分時可以參考機器評分,減少教師工作量。同時,教師評分為機器評分提供機器學習的經驗數據,促進機器評分更加智能。智能分析模塊能夠依據學生的在線課程學習模塊、課堂學習模塊、作業管理模塊等搜集到的學習行為數據進行綜合分析,促使教師深入了解學生的學習情況和個性化特點,提升教學的針對性,并且有助于后續對學生進行全面、綜合的分析和成績評定。所有系統模塊中使用到的智能分析技術包括基本的統計分析、以及各類機器學習算法(k-means,NaveBayes,SupportVectorMachine,DeepLearning等等)。⑷改變傳統成績考核的方式在“教學”+“實驗”+“研討課”課程結構以及網絡智慧教學綜合平臺的輔助之下,學生的成績評定更加全面化、多元化、公平化、自動化[7]。平時成績中,除了教學綜合平臺的“課堂簽到”次數之外,還增加更多豐富多元化的考察信息,如:學生的課堂討論、在線課程學習和考核結果、平時作業完成情況,以及智能分析模塊中輔助分析的學習態度、學習能力、平時成績預測。期末上機考試系統也是智慧課堂綜合平臺的一個子模塊,是精心設計的穩定、安全、功能強大的子系統,方便教師每一年更新試題庫,修改bug。試題庫中的每一套試卷都應當經過科學的考卷質量分析,使其難度、覆蓋范圍在一個均衡、合理的范圍。最后,教師通過對各類平時成績指標以及期末考試成績加權,給出最終的學習成績。通過規范、合理、公平、全面的考核體系,獲得對學生公平、完善的評價機制,激勵學生并刺激教學良性運轉。
3結束語