計算機視覺的概念范文

時間:2023-12-22 18:04:27

導語:如何才能寫好一篇計算機視覺的概念,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

計算機視覺的概念

篇1

關鍵字:大數據;數據挖掘;分類算法;概念漂移

中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)09-0011-03

Design and Implementation of Flow Mining Algorithm and Resistance Concept Drift System Based on Storm Platform

LU Yuan-fu, PENG Tian-ci, Ji Kai-yang, TAN Hai-yu

(College of Computer Science, Nanjing University of Posts and Telecommunications, Nanjing 210046, China)

Abstract:With the rise of cloud computing and Internet of things(LOT) technology,stream data widely exist in all fields as a new mega data form.This article propose a stream-classifying algorithm and system oriented to big data,which is based on DCP (Distributed Computing Platform).Parallelize windows and CVFDT algorithm are both adopted.We use a DCP to test whether the mutation concept drift happened in data stream,so as to change the inflow of modeling sample data adaptively.The accuracy and efficiency of stream data model will be improved at last.

Key words: big data; data mining; classifying algorithm; concept drift

1 背景

隨著云計算、互聯網+等技術的快速發展,生產制造控制、無線通信網絡、電子商務交易、金融信息監控等領域形成了高速、海量、動態的數據流,而有效的對數據流進行處理并從中挖掘有價值的信息就顯得尤為重要。

在流數據分類挖掘中,概念漂移是指流數據特性的改變使得目標分類模型隨著時間的變化而變化。針對流數據挖掘過程中的概念漂移問題,Hulten等人提出了概念自適應快速決策(Concept-adaptingVeryFastDecisionTree,CVFDT)算法[1]。CVFDT 算法是一種擴展了VFDT算法用以解決概念漂移問題的高效算法,通過在原有的算法基礎上改進添加滑動窗口使得建立決策樹模型的數據流能夠不斷實現更新,從而保證在概念漂移的數據流中模型建立的準確率。

本文主要討論研究了基于分布式實時計算系統STORM平臺的去概念漂移算法及系統的設計與實現,在流挖掘過程中,利用分布式平臺的特點采用并行化窗口方案來檢測數據流中是否發生概念漂移,并行化窗口bin-win根據數據流中的概念漂移自適應調整窗口大小,從而自適應的改變建模樣本數據的流入,提高了流數據的準確性和高效性。

2 算法分析與實現

2.1 CVFDT算法

2.1.1 CVFDT算法的原理

概念自適應快速決策樹(CVFDT)[2]是一種擴展了VFDT算法用以解決概念漂移問題的高效算法,具有類似VFDT的HT樹生成過程,在保持了VFD的速度和精度的前提下,能夠處理樣本產生過程中所出現的概念漂移問題[3]。CVFDT對樣本維持一個滑動窗口,并能夠動態改變窗口的大小。CVFDT算法過程包括CVFDTGrow過程、ForgetExample過程、RemoveExample過程和CheckSplitValidity過程。算法主要思想是先根據當前的數據構建臨時決策樹,然后并不斷地獲取新的數據去優化已建立的決策樹。若在某個時候出現了概念漂移,則算法會在出現漂移的節點上建立一個新的替代子樹。當替代子樹的分類效果優于當前的決策子樹時,就直接取而代之。

2.1.2 CVFDT算法抵抗概念漂移問題

概念漂移表示目標變量的統計特性隨著時間的推移以不可預見的方式變化的現象[4]。在流數據分類挖掘中,也指流數據特性的改變使得目標分類模型隨著時間的變化而變化。CVFDT周期性的掃描HT生成樹的內部節點來檢驗原先的分裂節點是否依然是最優的分裂屬性節點。當該節點發生了概念漂移,最優分裂屬性節點已不再是原先的Xa。CVFDT算法會重新尋找最佳測試屬性,新的屬性不直接取代原有的測試屬性,而是成為一個替代子樹的根節點,并且依據該根節點建立替代子樹。如果后繼滑動窗口的樣本在替代子樹上有較高的分類精度,則替代子樹便取代原先的決策樹,以維持滑動窗口的樣本和更新后的決策樹的一致性。

2.2 基于STORM平臺的CVFDT算法實現

2.2.1 CVFDT并行化窗口抵抗概念漂移算法設計

本小節討論以STORM作為分布式實時計算平臺,結合CVFDT流挖掘算法,解決數據流的概念漂移問題,從而提高模型建立的準確性。基于storm分布式平臺的并行化窗口抵抗概念漂移方案,通過并行化窗口bin-win對數據流實時檢測實現概念漂移抵抗[5-6],窗口調整流程圖如圖1所示。

從流程圖中,可以看到并行化窗口根據數據流中的概念漂移自適應調整窗口大小,當窗口檢測數據流未發生概念漂移時,則增大窗口中的樣本量,反之,則減小并行化窗口的大小,有利于較快的適應概念漂移。

其中,檢測是否發生概念漂移模塊,通過對HT樹中的非葉子節點的替代子樹調用CheckSplitValidity函數,計算屬性增益,從而判斷是否發生概念漂移,流程圖如圖2 所示。

2.2.2 CVFDT算法實現與分析

在現實生活中,大部分數據都是非平穩分布的,數據流根據時間的推移不斷發生變化,即發生了概念漂移[7]。CVFDT算法通過并行化窗口檢測數據流是否發生概念漂移,窗口太大不能快速有效的抵抗數據流中的概念漂移,窗口太小影響模型建立的時間和模型一段時間內的穩定性,如圖3所示在建立決策樹模型時檢測到概念漂移,則減小窗口的大小。當數據流穩定時,則增大窗口的大小,從而有效建立準確的決策樹模型。

3 系統實現

3.1 系統總體架構

CVFDT算法在STORM平臺上的實現方式有兩種,一種是垂直并行化實現,一種是結合隨機森林的實現,該抵抗概念漂移系統的設計主要基于垂直并行化的實現方式。系統包括三大模塊:并行化窗口模塊、抵抗概念漂移模塊、決策樹建立更新模塊。系統整體框架如圖4所示。

3.2 系統界面

抵抗概念漂移流分類挖掘系統參數設置界面如圖5所示,用戶輸入訓練樣本、更新樣本、測試樣本以及樣本所在文件的具體地址。點擊確定之后傳輸相應參數,CVFDT算法執行結束之后,彈出該算法挖掘結果顯示窗口,姐main如圖6所示,結果展示界面輸出當前決策樹以及其評價結果,以及未分類樣本的標記結果[8]。

4結束語

本文以分布式實時計算STORM平臺,設計并實現CVFDT算法,解決在流數據挖掘過程中出現的概念漂移現象,保證了流數據分類挖掘模型的準確性和高效性。CVFDT算法對樣本數據維持一個滑動窗口,在新樣本到達的時候更新節點上的統計信息,并在樣本滑出窗口的時候肩上其對應的統計信息。STORM平臺保證算法能夠提前預測數據流中的概念漂移,并實時更改窗口的大小,提高決策模型的準確性。

本文設計實現的算法與系統僅僅只是數據挖掘的一個方面,隨著大數據時代的到來,數據流會越來越大,并且會不斷變化,這就影響到了決策模型的建立與改善,因此,如何設計準確的算法和平臺來徹底解決流數據的概念漂移仍然需要進一步的研究。

參考文獻:

[1] Hulten G, Spencer L, and Domingos P. Mining time-changing data streams[C]//Proceedings of the Seventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, California, USA, 2001: 97-106.

[2] Ganti V, Johannes Gehrke, Raghu Ramakrishnan. Mining Data Streams under Block Evolution. [J].SIGKDD Explorations, 2002, 3(2).

[3]Street W N, Kim Y S. A streaming ensemble algorithm (SEA) for large-scale classification[C]//Proceedings of the seventh International Conference on Knowledge Discovery and Data Mining. San Francisco, USA, 2001: 377-382.

[4] Mitchell T M. Machine learning[M]. New York City: McGraw-Hill, 1997.

[5] 楊雅雙. 關聯規則的并行挖掘算法研究[D]. 西安:西安科技大學,2010.

[6] 唐耀紅. 數據流環境中關聯規則挖掘技術的研究[D]. 北京:北京交通大學,2012.

篇2

【關鍵詞】Opencv;計算機視覺技術;系統;研究

隨著計算機技術的快速發展,計算機設備逐漸被應用到社會生活的各個方面,尤其是在當前計算機視覺技術和圖像處理技術快速發展的時期,各個科技領域中的計算機視覺技術已經逐漸成熟。計算機視覺技術主要是利用計算機智能化來替代人眼,即對于客觀存在的三維立體化世界的理解和識別,整個實現過程均是以計算機技術作為基礎。隨著計算機視覺技術的不斷發展,現今其已逐漸成為了一門神經生理學、計算機工程、信號學、物理學、應用數學等綜合性學科。計算機視覺技術系統其在高性能計算機基礎之上來實現對大量數據的獲取,并且通過智能算法來對獲取數據進行處理,從而完成對數據集成。

一、視頻中運動物體檢測原理

對于視頻中的運動物體檢測主要分為兩中方法,其一為宏觀檢測法;其二為微觀檢測法。宏觀檢測法是對獲得的整幅圖像進行檢測,而微觀檢測法則是對所需要的區域進行圖像檢測。視覺技術在檢測運動物體的時候,首先對圖像進行采集,并對采集的信息數據進行預處理,將圖像進行分割,然后分別提取運動物體的影象,從而實現參數的更新。圖像采集過程中采用背景差分法,實現對背景圖像的提取,其通過一定算法采用人為手段獲取沒有背景的圖像。另外在進行運動物體檢測的時候還可以采用幀間差分法,其主要是實時獲取幀圖,然后實現一幀一幀圖像比值的比較,從而獲取具有差值的圖像。運動物體進行檢測的時候需連續獲取幀圖,將這些幀圖組合起來,其實就是物體的運動軌跡,然后同分割技術就能勾勒出物體的輪廓。隨著計算機視覺技術的不斷深入研究,發現此兩種方法單獨使用仍然存在的一些缺點,于是研究人員將二種檢測方法進行融合,形成一種綜合檢測方法。綜合檢測法將兩者檢測方法的優勢進行了融合,并將其靈活的應用到了生產和生活之中,取得了十分不錯的效用。

二、基于Opencv的計算機視覺技術探究

(一)基于Opencv的運動物體檢測

運動物體在進行檢測的時候,基于Opencv的檢測原理主要為:根據物體某項特定信息,例如,顏色、輪廓、性狀等,在復雜背景中利用這些特定的信息將物體分離出來。整個圖像的分離過程首先是進行視頻流捕捉,然后是進行視頻的格式轉換,再將圖像進行預處理,從而提取前景物體,減少環境因素對圖像處理的誤差,最后根據物體特征提取,并完成對運動物體的跟蹤。從圖像中提取所需的目標物體,其實質就是對整個屋里輪廓進行檢測和分割,根據每個圖像的幀差異來進行提取。

(二)基于Opencv圖像預處理

視覺技術應用于復雜的環境之中,由于存在著光照的變化,其場景中所出現的環境因素對視頻采集設備性能影響很大。環境因素會使得獲取的圖像信息的質量降低,并且在圖像中無法避免的存在著噪點,這對于運動物體的檢測和圖像采集會造成很大的影響。當獲取視頻幀圖像之后需對其數據進行預處理,通常有平滑度濾波處理、圖像填充、圖像背景更新等。

1.平滑度濾波處理

由于在進行視頻圖像采集的時候存在著噪點,那么我們就需要對其進行噪點處理,以求減小噪聲。濾波平滑度濾波處理,其具有線性和非線性兩種方式,其中線性方式進行處理器運算簡單、運算速度快,但是在進行處理之后的圖像都會呈現不清晰的情況。而非線性方式盡心給處理之后,雖然能夠很好的減小噪點,確保信號的局部特點,但是其運算的速度會較慢。

2.圖像填充

對于幀圖像進行處理,通常采用檢測邊緣填充法或者是腐蝕膨脹法來完成,其中填充法是指當檢測出目標物體之后,利用邊緣檢測方法來對物體進行辨識,然后利用形態學的漫水填充法進行填充。圖像的腐蝕膨脹則主要是由于攝像機的性能等問題造成的。

3.實時背景更新

在進行圖像差分之前,需要對背景圖樣進行確定,并且需要對其進行初始化處理。以方便以后在進行檢測時候能夠對實時背景圖進行差分計算,只有這樣,才能夠獲得極佳的前景效果。在進行圖像差分時,首先需要根據指定法來確定第一幀背景的圖像,并將其指定為第一張背景圖片,然后在檢測過程中根據算法對背景實施更新。整個圖像在進行更新時,其主要的流程為:判斷并讀取圖像是否為第一幀;將Opencv處理的圖像轉化為單通道灰度值;將實時采集的圖像進行高斯平滑度處理,去除噪點;最后使用形態學濾波處理噪點。

(三)提取前景運動物體圖像

檢測運動物體的時候,只有在檢測流程中確保精確度,才能夠獲取滿意的前景跟蹤效果。此過程中主要分為兩個步驟,第一步為二值化圖像之后進行分割;第二步,圖像分析前處理,進行充分填充,確保前景圖的完整性。其中,前景圖的提取主要分為下面幾個步驟:首先對前景圖像和背景圖像進行差分,然后對差分的圖像進行二值化,再對背景中的前景圖像邊緣進行檢測,根據輪廓進行填充圖像。由于攝像頭存在于不同的場景和環境之中,不論是室外或者是室內隨著場景的變化都會對圖像的采集產生影響。那么在前景圖中提取目標就需要在檢測系統中采用有效手段來完成背景實時更新。

閥值二值化分割法可以對檢測的物體進行前景和背景差圖分割,從而使目標物體能夠分離出圖像,且閥值分割先要確定每個像素的點是否處于灰度范圍值之內。將圖像中的像素灰度與確定的閥值進行比較,其結果解釋所有像素點分為2類,一類像素的灰度小于閥值,另外一類就是大于閥值。閥值二值化分割時,確定分割的閥值T,然后分割圖像。選取合適的閥值進行分割,可以有效的減少光照因素影響,常用的動態閥值主要有直方圖來法與最大類方差法這另種分割方法。

三、計算機視覺三維技術

計算機視覺技術的核心為分割問題、運動分析、3D立體場景重構等,立體視覺主要是從多幅圖像的參照中獲取目標物體的三維幾何信息。計算機視覺所模擬出的3D立體畫面只需要攝像機從不同的角度同一時間針進行圖像捕獲,將2D信息進行3D重構,進而將計算機程序重建于真實的三維場景之中,以恢復物體的真實空間信息。

(一)視覺系統

視覺系統捕獲圖像的過程,實則可以看成為對大量信息進行處理過程,整個系統處理可以分為三個層次,其一,理論層次;其二,描述層次;其三,實現層次。在攝像機視覺系統之中,輸入的是2D圖像,但是輸出為3D信息,而這就可以實現對圖像的位置、距離等信息的如實描述。視覺系統分為三個進階層次,第一階段為基礎框架;第二階段為2.5D表達;第三階段為三維階段。在第二階段中實現的2.5D表達,其原理是將不完整的3D圖像信息進行表達,即以一個點為坐標,從此點看去某一些物體的部分被遮擋。第三階段的三維階段,則是人眼觀察之后可以從不同的角度來觀察物體的整體框架,從而實現了將2.5D圖像信息的疊加重合運算,進一步處理之后得到了3D圖像。

(二)雙目視覺

人們從不同角度觀看同一時間內的同一物體的時候,可以利用算法測量物體間的距離。此法被稱為雙目立體感覺,其依據的原理是視覺差原理,利用兩臺攝像機或者一臺攝像機,對兩幅不同的圖像進行不同角度觀察,并且對其觀察的數據進行對比分析。實現雙目立體視覺與平面視覺圖像獲取,其主要的步驟為:

(1)圖像獲取

從兩臺不同的攝像機,捕獲幀圖像,由于環境因素會造成圖像差異困難。為了更好的跟蹤目標、檢測,當捕獲圖像之后,需要對圖像進行預處理。

(2)攝像標定方式

獲得真實坐標系中的場景點中的與平面成像點占比見的對應關系,借用三維立體空間中的三維坐標,標定之后確定攝像機的位置以及屬性參數,并建立起成像的模型。

(3)特征提取方式

所謂的特征提取方式主要是為了提升檢測、跟蹤目標的準確性,需要對目標物體進行特征提取,從而實現對圖像分割提取。

(4)深度計算

深度信息主要是根據幾何光學原理,從三維世界進行客觀分析,因為距離會產生不同的位置,會使得成像位置與兩眼視網膜上有所不同。簡單來說,客觀景物的深度可以反映出雙目的視覺差,而利用視覺差的信息結合三角原理進行計算,可呈現出深度的圖像信息。

(三)攝像機模型

攝像機在標定過程中確定了其建立的基礎為攝像機的模型,攝像機模型在標定過程中關系到三個不同坐標系的轉換,分別為2D圖像平面坐標系、攝像機自身坐標系以及真實的世界坐標系。攝像機在攝像的時候起本質是2D圖像坐標轉換,首先要定義攝像機的自身坐標系,將坐標系的原點設置為光心,X、Y、Z成立三維坐標系。其次則是建立平面的圖像坐標系,用以透視模型表示,其原點也在廣心的位置,稱之為主點。實際應用中,物理的距離光心的位置d≠f焦距,而且會遠遠大于焦距,為了解決如此問題就提出了平面概念。在光軸z上設置一個虛擬的圖像平面,然后在此位置于平面關于光心對稱。接著,在設置的虛擬2D坐標系中,光軸和原點重合,并且攝像機與垂直平面的垂直方向相同,真實圖像上的點影射到攝像機坐標系。

(四)3D重構算法

視頻流的采集,主要是采用Kinect設備、彩色攝像頭、紅外發射攝像頭、紅外接收攝像頭。使用微軟提供API控制Kinect設備,在操作之前需調用NUI初始化函數,將函數的參數設置為用戶信息深度圖數據、彩色圖數據、骨骼追蹤圖數據、深度圖數據。上述的視頻流的打開方式不同,既可以是一種打開方式,也可以是多種打開方式,尤其在進行Kinect傳輸數據處理的時候,需遵循三條步驟的運行管線。此三條管線分別為:第一條為處理彩色和深度數據,第二條為根據用索引添加顏色信息,并將其放入到深度圖之中,第三條為骨骼追蹤數據。

四、總結

隨著計算技術的快速發展,視覺技術逐漸被廣泛的應用于我們日常的研究之中。本文通過對視覺技術的相關問題進行分析,探究了圖像處理、分割、前景提取、運動物體觀測以及重構3D圖等問題,為實現視覺技術更加深入研究做出了相應的貢獻;為廣大參與計算機視覺技術研究同仁提供一個研究的思路,為實現視覺技術的騰飛貢獻薄力。

參考文獻

[1]張海科.基于Opencv的人手識別與跟蹤定位技術研究與實現[D].云南大學,2013.

篇3

關鍵詞OpenCV;科學教育;推廣價值

1、OpenCV庫簡介

OpenCV是由Intel微處理器研究實驗室的視覺交互組開發的一個跨平臺計算機視覺庫,它的代碼都是開源的而且都經過非常好的優化,并且具有很好的移植性,可以根據需求導入到合適的環境中使用。它可以實現有關圖像識別與處理和計算機視覺技術方面的很多通用算法。它的優勢是可以運行在當代社會使用熱門的各大操作系統上,適用性強,還可以脫離外部庫而獨立運行。OpenCV的C和C++都是經過優化的開源代碼,采用靈活的接口,提升計算機的運行速度。其中包含的函數就有500多個,包括的種類有C和C++等。OpenCV因為免費面向市場,已經被社會各界廣泛使用。現已應用于人機互動、圖像識別、圖像分割、目標追蹤、3D重建、機器視覺、結構分析等數個領域。OpenCV主要包括以下幾個部分:①cxcore:核心功能模塊,包含一些基本函數,運用于各種數據類型的計算。②cv:圖像處理和計算機視覺功能。③ml:機器學習模塊,主要內容是分類器。④cvaux:包括大部分實驗性的函數,例如ViewMorph-ing、三維跟蹤、PCA、HMM等。⑤Highgui:圖像界面接口,支持攝像頭的讀取和轉換。

2、OpenCV處理圖像的功能

OpenCV中有很多的函數,可以實現很多不同的功能,其中最具有學習價值的部分就是圖像處理。處理圖像主要分為三部分:加載圖像,顯示圖像,處理圖像。

2.1加載圖像

不同類型的圖像有著不同的內部結構。我們需要根據圖像的結構采用合適的方法將圖像文件中的數據讀入內存。OpenCV中的cvLoadImage()函數,可以加載圖像數據。而且圖像的格式不影響加載的效果,加載后它以一個指向IplImage結構體的指針形式返回,大大方便了后續處理的過程。2.2顯示圖像加載圖像后需要通過函數使其顯示。cvNamedWindow()函數由HighGUI庫提供,它可以在屏幕上創建一個窗口,將圖像顯示出來。cvShowImage()函數的作用是在這個創建的窗口中顯示出加載過后的圖像。觀察圖像時經常用到的重要函數還有可以使程序暫停的函數cvWaitKey(),以及用于釋放內存的函數cvReleaseImage()和cvDestoryWindow(),掌握并運用這些函數,就可以輕松的實現觀察圖像的功能。

2.3處理圖像

OpenCV中包含的多種函數,可以達到圖像處理技術方面的很多效果,包括圖像灰度化函數cvtColor(),邊緣檢測函數Sobel()、Laplacian()、Canny(),其中Canny算子只能處理8位灰度圖,其余兩種8位32位都可以,合并梯度函數addWeighted(),放大縮小函數resize(),閾值化操作函數imshow()等等。適當選用合適的函數并加以運用即可達到目標所需。

3、OpenCV的推廣價值體現

OpenCV可以應用在社會的各個領域,價值就體現在每個科學的產物當中。舉個近在身邊的例子,隨著社會的發展,生活質量的提高,人們的居住環境也在逐漸改善,樓層越蓋越高,無數摩天大樓,商業大廈群起而立,電梯已經成為了我們日常生活中必不可少的工具。盡管現在電梯的功能、質量不斷地提升,但是仍然存在些許不足,當我們在學校的教學樓內等電梯時發現了一個問題,那就是在電梯使用的高峰期時,比如在上下課時段,有很多人都在同一樓層等電梯。但是此時只有一臺離該樓層最近的電梯會過來,而其余的電梯都會自動向其它叫梯樓層運行或是閑置。可是此時這一臺電梯只能容納有限數量的人,時常不能使所有人坐上電梯,這樣就無法滿足全部人的需求,由此就導致了有部分人無法及時地坐上電梯,需要繼續等候,而閑置的電梯又不能及時地被利用。這樣不僅不能合理地利用資源,反而浪費了許多不必要的時間。因此,我們想到可以通過利用圖像識別與處理的方法來彌補這個不足,首先通過硬件設備連接拍照捕獲候梯人像,后臺運行判斷出候梯人數,然后運用語言編程來確定調動電梯的個數,從而來達到實現自動控制每個電梯的運行的目的,使所有人都能在第一時間乘坐電梯。而上文中提到的OpenCV就可以完成這項艱巨的任務。我們將OpenCV導入編程環境,其次修改電梯工作系統的運行程序,將軟件與硬件設備相連通,這樣通過調度程序,就可以輕松高效地解決這個問題。使用這種方法,不僅可以節約人們的候梯時間,方便學生、老師上課,而且可以合理有效地調度電梯,使電梯的價值得到最大化。見微知著,OpenCV可以應用在每個領域,對各界的發展起到推動作用,造福社會的科技發展,方便人們的生活。

4、科學教育存在的問題

在歷年的教學模式中,老師們往往會強調理論知識的重要性,但卻忽略了對學生使用動手能力的培養,學生不能獨立完成實踐性的技術操作,也就是說教學模式缺乏實踐性。只有將理論與實踐相結合,才能實現知識價值的最大化,因此,應當在教學中配合著實踐課程,舉一反三,讓學生們更加深刻地學習和了解所學到的知識。而如今雖然一部分學校也開設了實踐課程,但也只是淺嘗輒止,并沒有過多地講授計算機技術實踐方面的知識,學生們也沒有真正擁有動手實踐能力,這使學生們的技術知識十分受限。雖然現在多數學生對計算機略懂一二,但是實際上僅僅會使用類似Word等簡單的軟件,而技術要求較高的一些軟件及工具卻全然不知,甚至對自己所學過的課程軟件的使用也是馬馬虎虎,這對于未來工作所需的能力來講,實在是九牛一毛。目前中學生使用電腦的重心更多放在了社交軟件和游戲上,很少有人利用計算機學習更多的技能,這對青少年的發展實在是利大于弊的,而且這樣也失去了計算機的正向價值。因此,我們應該改變現有的教學模式,一邊教授理論知識,一邊配合指導學生動手操作,將理論與實踐相結合,也能讓學生更好地消化和吸收所學到的知識,并且引導學生正確使用計算機,發揮計算機的價值,讓學生們都能夠在計算機中獲得更多的知識。

5OpenCV開源算法庫在各個領域的實例化體現

OpenCV在醫學領域、軍事領域、安全防護領域等都有很大的重要意義。在醫學領域中,由于有了這個開源算法庫,我們可以盡可能地調用它,從而來進行圖像處理、對象檢測,讓醫生更好更快速觀測人體結構,及時發現病癥。在軍事領域中,大多數無人操作的機器運作,比如無人機飛行、水下無人駕駛儀、無人駕駛汽車等等,都需要用到OpenCV來對圖像進行處理,并進行分析,并且可以檢測出人眼看不到的事物,這是OpenCV能夠帶來人類的巨大的進步。在安全防護領域中,我們現實生活中常見的汽車的安全駕駛,房屋入侵的檢測、自動監視報警系統等等,正是由于這些技術,讓我們的環境更加安全,這都是我們生活中息息相關不可缺少的。現如今,國家的科學技術飛速發展,日益強盛,OpenCV的成績有目共睹,未來的發展需要科學技術的不斷推進,才能為祖國未來的其他事業提供強有力的后盾。

6OpenCV在科學教育中的作用

在文化改革的大背景下,文盲的概念早已從沒有文化轉變成了不會使用計算機。因為隨著科技的進步,計算機的使用已經越來越廣泛,計算機已經逐步取代了以往人工可以完成的許多工作,比如在超市生成的結賬單、用計算機控制動力系統的運行、人造衛星軌跡的計算等等,這些都依賴于計算機強大的功能。計算機的推廣證明著我國科技的發展和人類文明的進步,由此可見,計算機技術知識的掌握對現代人來說是十分重要的。如果想要成為一個真正有技術、有能力的人才,就務必要熟練掌握計算機技術的使用。但是目前當代社會的教育在計算機技術方面的內容還不夠豐富。減壓政策開放以來,教育課時被壓縮,技術知識的傳輸也相應減少,學生們的能力也因此日益下降。而科學教育,顧名思義,是使科學技術在教育過程中得以傳承。想要科學地教育學生,就必須要多多講授科學技術方面有關的知識。說到科學技術,它的重點自然是計算機技術,而OpenCV作為計算機視覺技術的核心,可以說也是計算機技術甚至科學教育中的一個重要部分。在教育中普及并傳承這個技術無疑可以提高學生們的技術水平。但是,相信有大多數的人在此之前從未聽說過計算機視覺技術,也并不了解OpenCV庫,更加不會學習到與之有關的技術知識。在這樣嚴峻的形勢下,我們更應該將類似OpenCV方面技術有關的知識通過教育傳遞下去。各大高校應積極開展有關計算機的活動,開設與計算機技術有關的課程。這樣才能根據社會的需求來培養更多的綜合性人才。如果可以將其投入到現代教育當中,定會使現在的教育事業更加輝煌,也能使祖國的未來更加璀璨。

參考文獻

[1]于仕琪,劉瑞禎.學習OpenCV(中文版)[M].北京:清華大學出版社,2009.

[2]陰法名.基于OpenCV圖像處理[J].科技信息,2009(32):220.

[3]賈小軍,喻擎蒼.基于開源計算機視覺庫OpenCV的圖像處理[J].計算機應用與軟件,2008,25(4):276-278.

[4]陳勝勇.基于OpenCV的計算機視覺技術實現[M].北京:科學出版社,2008.

[5]劉潔,馮貴玉,張汗靈.一種圖像處理和計算機視覺的開發工具[J].計算機仿真,2006(11).

篇4

關鍵詞:機器視覺技術;大米;品質檢測

中圖分類號:TP391.4 文獻標識碼:A 文章編號:0439-8114(2012)05-0873-04

Application Progress of Machine Vision Technology in the Quality Inspection of Rice

WAN Peng,LONG Chang-jiang,REN Yi-lin

(College of Engineering, Huazhong Agricultural University, Wuhan 430070, China)

Abstract: The research dynamic of machine vision technology was reviewed from the aspects of rice varieties, germ, crack, yellow grain rice, and so on; and the shortcomings of the machine vision technology in rice quality inspection were proposed for its further application.

Key words: machine vision technology; rice; quality inspection

我國是世界上最大的稻米生產國,稻米年產量常年保持在1.8億t左右,占世界稻米總產量的1/3,居世界第一位[1]。我國也是大米消費大國,有近2/3的人口以大米為主食,全國大米年消費總量保持在1.35億t左右[2]。我國的水稻研究在世界上處于領先地位,但是在國內外貿易、加工和消費等領域中仍然存在諸多問題[3,4]。

我國曾經是世界三大稻米輸出國之一,但是由于我國大米的品質不高,再加上大米的生產標準、質量技術標準、檢驗檢疫技術等與發達國家存在較大差距,在相當程度上影響了我國大米在國際市場上的競爭優勢,大米的年出口量已退居六七位。2008年以來,隨著世界稻米產量的下降,各國對大米出口配額進行調整,導致國際大米的價格出現了瘋漲,而我國出口的大米因品種不穩定、品質較差,在國際市場上競爭力較低,市場份額逐漸減小。

為了提高大米的品質,不但需要選育優質的稻米品種,還需要加強大米品質的檢測。但是,由于我國對大米品質的檢測研究起步較晚,同時也缺乏方便簡單的檢測方法和快捷準確的檢測儀器,在對大米品質進行檢測的過程中,主要依靠人工識別、感官評定等方法進行檢測,這些方法主觀性較強,準確度較低,可重復性較差,工作效率也較低,因此在實施過程中的有效性受到了質疑[5]。

機器視覺(Machine vision)又稱計算機視覺,是指利用計算機實現人的視覺功能,是研究采用計算機模擬生物外顯或宏觀視覺功能的科學和技術,是一門涉及數學、光學、人工智能、神經生物學、心理物理學、計算機科學、圖像處理、圖像理解、模式識別等多個領域的交叉學科[6]。機器視覺技術在農業上的應用研究始于20世紀70年代末期,主要進行的是植物種類的鑒別、農產品品質檢測和分級等。隨著計算機軟硬件技術、圖像處理技術的迅速發展,它在農業上的應用研究有了較大的進展[7,8]。

目前,大部分的大米品質檢測指標根據國家標準采用人工進行檢測,容易產生許多問題。隨著機器視覺技術的發展和在農產品無損檢測領域的廣泛應用,采用機器視覺技術對大米的品質進行檢測,不僅能夠提高大米品質的檢測效率,而且能夠克服主觀因素的影響,降低檢測誤差,使得大米品質的檢測變得更加快速和準確[9]。

1 基于機器視覺技術的大米品質檢測裝置

基于機器視覺技術的大米品質檢測系統由檢測箱、檢測臺、光源、CCD圖像傳感器、鏡頭、圖像采集卡和計算機系統等幾個部分組成[10,11](圖1)。

大米品質檢測系統是一個內空的箱體,箱子的底部是檢測臺,頂部為光源和攝像頭;檢測箱內表面粘貼有背景紙,使光在箱體內形成均勻的漫反射,避免樣品在檢測時形成鏡面反射。光源提供樣品檢測照相時所需的亮度,為了提供充足的光線,同時盡量消除光源照射樣品時在背景上產生的陰影,通常選用環形熒光燈管作為光源[12]。CCD圖像傳感器是獲取數字米粒樣品圖像的關鍵部件之一,它將大米圖像由光信號轉換為表示R、G、B顏色值的模擬電信號,并輸入圖像處理設備進行后續處理[13]。計算機軟件系統用于對采集到的數字圖像進行分析、處理和識別,實現對特定目標的檢測、評價等[14]。

2 基于機器視覺技術的大米粒形檢測

大米的粒形是實現大米分級和質量檢測的最基本參數。根據《GB1345-1986大米》中的規定,評價大米質量的檢測指標主要有加工精度、不完善粒、雜質、碎米等,這些檢測指標與大米的粒形直接或間接相關。由于人工評價是通過肉眼觀察對大米粒形進行評價,因此受檢測環境、視覺生理、視覺心理等諸多因素以及評價人員對大米標準理解程度不同的影響,即便是同一份大米樣品,很難保證大米粒形檢測結果的穩定,而采用計算機視覺技術進行檢測則可以有效避免主觀因素的影響,保證大米粒形檢測結果的準確性[9,15]。

中國農業大學孫明等[16]借助于MATLAB圖像處理工具箱對大米粒形進行測定。首先定義單粒大米子粒的粒長(A)與粒寬(B)的比值為粒形,檢測時先求出大米粒的橢圓離心率R,通過公式:

■=sqrt■

將大米子粒的橢圓離心率轉變為長寬比A/B,即求出大米子粒的粒形。試驗結果表明,該方法具有操作簡單、檢測速度快、重復性好的優點。

武漢工業學院張聰等[17]提出了一種基于計算機圖像分析識別大米破碎粒的方法,即先采用數碼相機獲取大米圖片,再對大米圖片進行分析處理。識別時先將大米圖像的邊緣曲線變換為極坐標形式,再結合大米粒形的一般形狀,用橢圓模板定位米粒,獲得一組與米粒平移、旋轉和尺度無關的形狀描述數據,再運用小波變換提取奇異點及特征參數。試驗結果表明,該方法簡單有效,用于米粒定位與識別時的可信度高。同時,劉光蓉等[18]也研究了通過掃描儀獲取大米的圖像,再采用計算機圖像處理技術將彩色圖像轉化成灰度圖像并進行進一步的處理,最后獲得大米子粒的二值圖像,然后利用八鄰域分析法提取大米圖像的輪廓。試驗結果表明,這種方法的檢測效果良好。

此外,袁佐云等[19]還提出了采用最小外接矩形計算大米粒形的方法。包曉敏等[20]分析了采用Roberts算子、Sobel算子、Prewitt算子、模板匹配法和快速模糊邊緣檢測法對大米粒形進行邊緣檢測,并通過對大米圖像的分割試驗驗證了快速模糊邊緣檢測法最為有效。

3 基于機器視覺技術的大米加工精度檢測

大米加工精度是指大米背溝和粒面留皮程度,即糙米皮層被碾去的程度。大米的加工精度是決定大米外觀質量的主要因素,加工精度越高,米粒表面殘留糠皮量就越少,胚乳表面光潔度、口感、外觀品質也就越好。我國國家標準規定各類大米按加工精度分等級[9]。因此,大米加工精度的檢測具有十分重要的意義。傳統大米加工精度的測定有多種方法,國標中規定大米加工精度的判定采用試劑染色法[21],通過染色劑使米粒胚乳和胚乳表面殘留糠皮呈現不同的顏色差異便于肉眼觀測,該方法受到光照條件、視力、情緒等諸多因素以及各種染色參數的影響,操作繁瑣、效率低、誤差大,不能滿足快速、客觀檢測的需要。

河南工業大學張浩等[22]研究了機器視覺技術結合數字圖像處理技術檢測大米加工精度的方法,首先獲取大米的圖像,利用米粒區域和背景區域的亮度差異將大米圖像轉化為灰度圖像,再利用邊緣檢測函數求出分割閾值,將米粒從背景中分割出來,并計算米粒區域的面積;然后利用米粒區域中糠皮部分和胚乳部分R-B特征值差異,將大米圖像分解為R、G、B分量圖,以R-B矩陣代替大米圖像,再將R-B矩陣轉化為灰度圖,用邊緣檢測函數求出分割閾值把糠皮部分分割出來,計算糠皮部分面積。最后測得大米留皮率為米粒糠皮部分面積與米粒區域面積之比。

江蘇理工大學許俐等[23]將計算機圖像處理技術與色度學理論相結合研究了大米加工精度的自動檢測方法。檢測時先將大米染色,然后采用機器視覺系統獲取大米圖像,再根據染色后大米的胚乳、皮層以及胚芽所呈現的不同顏色特征,采用不同的區分方法獲取米粒不同部位的面積即像素的個數,然后根據胚乳面積與大米圖像總面積的百分比計算大米的加工精度。

此外,無錫輕工大學田慶國[24]根據色度學原理,采用圖像處理技術對染色后的大米進行檢測,識別大米的加工精度,并建立了大米染色后的顏色值與加工精度之間的數據庫。西華大學的劉建偉與日本岐阜大學的三輪精博[25]合作研究大米加工精度與碾白程度之間的關系時,采用改良后的大米精度鑒定NMG溶液,按照品紅石碳酸溶液染色法(GB 5502-85)對大米進行染色獲得米粒表皮呈綠色、糊粉層呈藍色、胚乳呈藍紅色的大米樣品,米粒干燥后采用測差計檢測樣品的顏色計算大米的加工精度。

4 基于機器視覺技術的大米堊白檢測

堊白是指稻米粒胚乳中不透明的部分。堊白之所以不透明是因為稻米子粒中淀粉粒排列疏松,顆粒間充氣引起光線折射所致。按其發生部位可將堊白區分為腹白、心白和背白等類型。通常用堊白粒率、堊白大小和堊白度等概念描述稻米的堊白狀況。堊白是衡量稻米品質的重要性狀之一,不僅直接影響稻米的外觀品質和商品品質,而且還影響稻米的加工品質和蒸煮食味品質[9,26]。

黑龍江農業工程職業學院于潤偉等[27]研究了采用機器視覺技術和圖像處理技術檢測稻米堊白的方法。先用機器視覺裝置獲取大米的原始圖像,再采用圖像處理方法對大米圖像進行預處理,然后應用大津算法自動選取分割閾值對稻米圖像進行兩次分割,分別得到大米子粒的二值圖像和堊白區域的二值圖像,再根據區域內部像素點的聯通性,將不同區域分別進行標記,計算出子粒數和堊白粒數,同時計算出二者對應的面積(像素點個數)。研究結果表明,該算法的自動檢測結果與人工檢測相關性大于90%。

中國農業大學侯彩云、日本東京大學Seiichi等[28]采用微切片三維圖像處理系統對大米的品質特性進行探索性研究,結果表明借助于三維可視化技術分析大米的微切片,不僅可以觀察大米堊白部分內部的組織結構以及在蒸煮過程中的變化,還可以利用灰度直方圖定量計算出堊白米粒中各部分堊白的面積和體積。同時,侯彩云等[29]還利用自行研制開發的機器視覺圖像處理系統對大米的堊白度及堊白粒率進行檢測,試驗結果表明所研制的裝置具有客觀、準確、快速和重現性好等特點,在大米的快速分等定級中具有良好的應用前景。

江蘇大學黃星奕等[30]研究了采用遺傳神經網絡計算大米堊白度的方法。先采用機器視覺系統提取堊白米的圖片,然后采用數字圖像處理技術提取米粒的堊白區域與胚乳非堊白區域的交界區域內的像素,再采用遺傳算法建立一個人工神經網絡識別系統對這部分交界區域內的像素進行識別。試驗結果表明,采用機器視覺系統的檢測結果與人工檢測結果的誤差小于0.05。

此外,凌云等[31]提出了一種基于分形維數的堊白米檢測算法。孫明等[32]采用了MATLAB軟件開發平臺構造了基于計算機視覺的大米堊白檢測算法,完成了對大米堊白參數、堊白度以及堊白粒率的測定。吳建國等[33]從實際應用出發,采用計算機和掃描儀結合開發了機器視覺系統的堊白測定軟件。而曾大力等[34]利用視頻顯微鏡對大米粒進行掃描,結合計算機圖形分析,直接計算大米的堊白大小和透明度,初步探討了視頻顯微掃描技術在大米堊白分析中的應用。湖南農業大學蕭浪濤等[35]開發了基于微軟Windows 98平臺的大米堊白度測定軟件Chalkiness 1.0,該軟件與計算機和圖像掃描儀相結合能夠組成一套高效的大米堊白度測定系統。

5 基于機器視覺技術的整精米率檢測

整精米是指糙米碾磨成國家標準一級大米時米粒產生破碎,其中的完整米粒以及長度達到完整精米粒平均長度4/5以上(含4/5)的米粒。整精米率是指整精米占凈稻谷試樣質量的百分率,它是稻米加工品質優劣的指標,是稻米貿易中商家最關注的內容,與碾米廠的經濟效益密切相關。正確識別整精米是檢測整精米率的關鍵。目前整精米率主要采用人工方法進行檢測,該方法難以滿足對稻米品質快速、準確的檢測要求[9,36]。

中國農業大學尚艷芬等[37]開發了一套基于機器視覺技術的整精米檢測系統用于識別整精米和碎米。該方法通過提取并分析稻米的粒長、粒形等特征參數,提出了同一品種并在同一生長條件下生長的大米粒形具有相似性的前提假設,據此求得標準米,再通過偏差計算、粒長、粒形分析等對整精米和碎米進行識別。采用該方法開發的整精米識別系統對整精米和碎米識別的準確率與人工檢測結果的相關系數可到達0.99。

于潤偉等[38]首先通過圖像識別系統采集大米的原始圖像,再采取動態閾值分割等圖像處理方法把米粒圖像變成二值圖像,然后根據區域內部像素的連通性計算出單個米粒的像素個數;再根據先期計算的整精米長度/面積比換算出米粒長度,最后根據米粒長度判斷整精米和碎米。研究結果表明,該算法的自動檢測與人工檢測的相關性大于99%,可用于整精米的自動檢測。

6 問題和展望

機器視覺技術在農產品的品質檢測方面具有廣泛的應用,國內外的學者在此領域進行過廣泛研究。但機器視覺技術在大米品質檢測領域的應用尚處于起步階段,仍有許多等待解決的技術問題,需要進一步深入研究。

1)目前的大米品質檢測裝置多為靜態檢測裝置,即將大米放于檢測箱中通過機器視覺系統獲取圖片或通過掃描儀獲取圖片,大米相對于攝像頭靜止不動;獲取圖像之后再采用計算機軟件系統對圖像進行分析處理。這種檢測方法效率低下,因此,動態地獲取大米圖像并進行分析檢測是下一個要解決的難題。

2)采用機器視覺系統檢測大米品質時,多采用的是串行化算法,即先獲取大米圖像,然后采用某種算法對大米圖像進行處理,再檢測大米的某項品質指標;之后再采用某種算法對大米圖像處理大米的另一項品質指標,這種檢測方法在處理群體米粒圖像時極大地影響了檢測速度,因此開發并行處理算法對大米圖像進行分析檢測可以有效提高機器視覺系統的工作效率。

3)目前對大米品質指標進行檢測分析時缺少統一的檢測裝置,有的研究者采用CCD攝像頭獲取大米的圖像進行分析檢測,而有的研究者采用掃描儀獲取圖像進行分析檢測,檢測裝置不同、檢測條件不一致難以達到相同的檢測結果,因此有必要研制具有實用價值的大米品質檢測裝置,使基于機器視覺技術的大米品質檢測能夠具有統一的標準。

總之,伴隨著計算機科學技術的迅速發展,機器視覺技術在大米品質檢測中的應用將越來越廣泛。

參考文獻:

[1] 龐乾林.稻米知識縱覽[J].中國稻米,2004(3):44-47.

[2] 劉月好.陳米產生的原因與處理方法[J].糧食加工,2004(1):30-31.

[3] 莊麗娟,刁慕容.中國谷物外貿格局與發展趨向分析[J].中國農墾經濟,2004(8):25-26.

[4] 山世英,彭玉珊.我國農產品出口遭遇技術性貿易壁壘的原因及對策[J].山東農業大學學報,2004,6(2):41-43.

[5] 李里特.糧油產品規格化、標準化是農業現代化的迫切任務[J].中國糧油學報,2001,16(5):1-5.

[6] 劉傳才.圖像處理與計算機視覺[M].廈門:廈門大學出版社,2002.

[7] 趙曉霞.計算機視覺技術在農業中的應用[J].科技情報開發與經濟,2004,14(4):124-126.

[8] 熊利榮,陳 紅,丁幼春.機器視覺技術在農產品破損檢測上的應用[J].農機化研究,2005(5):204-205.

[9] 李天真,周柏清.基于計算機視覺技術的稻米檢測研究[J].糧食與食品工業,2005,12(4):50-53,55.

[10] 凌 云,王一鳴,孫 明,等.基于機器視覺的大米外觀品質檢測裝置[J].農業機械學報,2005,36(9):89-92.

[11] 張巧杰,王一鳴,凌 云,等.稻谷品質檢測技術與裝置研制[J].現代科學儀器,2006(1):128-130.

[12] 趙志強,熊元姣.計算機視覺檢測系統的設計方案[J].工業控制計算機,2005,18(10):1-2.

[13] 唐向陽,張 勇,李江有,等.機器視覺關鍵技術的現狀及應用展望[J].昆明理工大學學報(理工版),2004,29(2):36-39.

[14] 張紀明.基于PC的機器視覺系統研究[J].可編程控制器與工廠自動化,2006(11):107-110.

[15] 任憲忠,馬小愚.農產品粒形識別研究進展及其在工程中應用現狀[J].農業工程學報,2004,20(3):276-280.

[16] 孫 明,石慶蘭,孫 紅,等.基于計算機視覺的大米外觀品質檢測[J].沈陽農業大學學報,2005,36(6):659-662.

[17] 張 聰,管庶安.基于圖像分析的大米形狀識別[J].糧食與飼料工業,2006(6):5-7.

[18] 劉光蓉,周 紅,管庶安.基于圖像處理技術的大米輪廓檢測[J].糧食與飼料工業,2004(6):14-15.

[19] 袁佐云,牛興和,劉傳云.基于最小外接矩形的稻米粒型檢測方法[J].糧食與飼料工業,2006(9):7-8.

[20] 包曉敏,汪亞明,黃振.計算機視覺技術在大米輪廓檢測上的應用[J].浙江工程學院學報,2003,20(2):104-107.

[21] 呂季璋,陳效貴,范慕蕙,等.GB/T 18105-2000米類加工精度異色相差分染色檢驗法[S].北京:國家質量技術監督局,2000.

[22] 張 浩,孟永成,周展明,等.基于圖像處理技術大米加工精度的檢測研究[J].中國糧油學報,2006,21(4):135-137.

[23] 許 俐,錢敏娟,方如明,等.大米加工精度的圖象識別方法[J].農業工程學報,1996,12(3):172-175.

[24] 田慶國.圖像處理技術在大米碾白精度測定中的應用[J].糧食與飼料工業,1997(10):10-11.

[25] 劉建偉,徐潤琪,三輪精博,等.大米加工精度與碾白程度檢測的研究[J].中國糧油學報,2004,19(3):5-8,61.

[26] 周新橋,鄒冬生.稻米堊白研究綜述[J].作物研究,2001(3):52-58.

[27] 于潤偉,朱曉慧.基于圖像處理的稻米堊白自動檢測研究[J].中國糧油學報,2007,22(1):122-125.

[28] 侯彩云,SEIICHI O,YASUHISA S,等.三維圖像處理系統在稻米品質檢測中的應用研究[J].農業工程學報,2001,17(3):92-95.

[29] 侯彩云,王一鳴,凌 云,等.堊白米粒的計算機圖像識別[J].農業工程學報,2002,18(5):165-168.

[30] 黃星奕,吳守一,方如明,等.遺傳神經網絡在稻米堊白度檢測中的應用研究[J].農業工程學報,2003,19(3):137-139.

[31] 凌 云,王一鳴,孫 明,等.基于分形維數的堊白米圖像檢測方法[J].農業機械學報,2005,36(7):92-95,91.

[32] 孫 明,凌 云,王一鳴.在MATLAB環境中基于計算機視覺技術的大米堊白檢測[J].農業工程學報,2002,18(4):146-149.

[33] 吳建國,劉長東,楊國花,等.基于計算機視覺的稻米堊白指標快速測定方法研究[J].作物學報,2005,31(5):670-672.

[34] 曾大力,藤 勝,錢 前,等.視頻顯微掃描技術在稻米堊白研究中的應用[J].中國農業科學,2001,34(4):451-453.

[35] 蕭浪濤,李東暉,藺萬煌,等.一種測定稻米堊白性狀的客觀方法[J].中國水稻科學,2001,15(3):206-208.

[36] 郭英群.對國家標準中整精米率定義及檢測方法的探討[J].糧油倉儲科技通訊,2005(6):52-53.

篇5

誕生于20世紀40年代的電子計算機是人類最偉大的發明之一。并且一直以飛快的速度發展著。進入21世紀的現代社會,計算機已經進入各個行業,并成為各行業必不可少的工具。如今的計算機發展的更加智能化,就如今來說,人們最什么事情都非常重視信息,人類和社會的發展,時刻都離不開信息。計算機如今重視的方面就是對信息的閱讀和控制,人臉檢測與識別技術也是應運而生。

人臉識別的論述

人臉識別是人類視覺中的一大特色,因為能對身邊的人進行識別,才不會對身邊的信息進行混淆,簡單來說,根據人臉可以對人的年齡,性別進行初步判斷。隨著計算機技術的智能化,計算機業已經通過視覺能進行人臉的識別。其中在對人臉識別的同時進行有關信息的收集、識別、提取、變換、存儲、傳遞、處理、檢索、檢測、分析和利用等技術。如今人臉識別已經應用于很多的領域,但是要人臉檢測與識別是需要基于本來已經收集和整理的信息本庫才能進行。再加上現在計算機技術雖然已經接近成熟,然而在人臉識別方面的表情傳達出什么信息還是無從下手進行編程和設計。所以,基于計算機視覺的人臉檢測與識別技術還是會有很廣的發展空間,再加上人臉識別還可以維護人們的財產安全和隱私保護,必然會引起社會各界人士的廣泛關注。

從19世紀末開始就已經有人對人臉識別進行了研究,因為當時沒有先進的科學技術做后盾,所以經過了數百年的研究仍然沒有什么顯著的進展和成果。直到20世紀90年代人臉識別才成立了自己的學科,在加上當時的科技發展水平已經達到了不錯的水平,人臉識別這個學科得到了快速的發展。如今,我國的計算機技術也已經居于世界的前列,我國也已經擁有比較完善的一套東方面孔的人臉數據庫。

人臉識別在發展過程中大概經歷了三個階段:第一階段就是對人臉特征進行整理,整理出所需要的數據庫,并且應用當時的計算機技術做出一套質量不錯的人臉灰度模型,這個階段的識別工作全部由操作人員來完成;第二階段比第一階段要先進,有了基礎人機互交,將人臉的特征經過多維度的矢量在模型上表示出來,并也可以設計出一套人臉識別的系統,這個階段的識別不再是僅僅依靠操作人員,而是操作者和計算機一起完成;第三個階段是計算機智能識別的最高峰,一切操作和識別都依靠機器全自動化進行,在人臉識別過程中也不再是每臺計算機都需要完成一整套的工作,也實現了計算機與計算機之間的互聯,多臺計算機一起完成人臉識別的過程,都人力也是一種解放。

積極踐行人臉檢測識別技術

人臉檢測識別技術是計算機實現智能化特征后的又一重要發展方向之一,它已經在世界范圍內得到了廣泛的普及與應用。人們可以通過人臉識別來進行定位,來起到保護人們財產安全的作用,通過人臉識別來抵制社會中的造假率,之前曾經有一些不法分子利用假身份來做損害公共利益和侵犯人們隱私權的事情,有了人臉識別讓不法分子沒有可乘之機,也應用人臉識別來對財務密碼進行聯系,起到對人們的財產有絕對的保護作用,對社會的安定何嘗不是一項有意義的發明。

人臉識別一直是計算機智能化發展過程中的一個重要領域,因為人臉的識別與檢測是一個很難做到完善的項目,由于人類的面部表情豐富,要對人類的面部表情做出判斷和分析會存在一定的困難。再加上人臉識別的過程中,每個獨立存在的個體都有一張專屬于自己的臉。它的輪廓沒有明顯的特征界限,同時對眼、鼻子、嘴等器官在臉上的分布情況也沒有明確的界限,這就使得對人臉識別來進行算法設計有一定的困難,所以只有通過輪廓特征來進行初步的判斷,分辯出各種器官,再根據器官來完成人臉的分布情況設計灰度模型的完成工作。

篇6

關鍵詞:多模態;檢索;圖像特征

0 引言

現階段基于圖像檢索普遍采用方式是人工對上傳到網絡中的數字圖像進行文字標注,根據每幅圖像的視覺特征人為的設置他們的文字描述。在檢索時,使用標注的文字作為關鍵字來檢索我們想要的數字圖像。這種依據圖像標注的文字匹配檢索的方法簡稱為“字找圖”,它的缺點為:(1)由于需要大量的人工對每幅圖像進行文字標注,數字圖像的數量是海量的,標注工作是非常耗費人力和時間;(2)由于每個人對圖像的認識不同,所以,在標注的過程中會按照自己對圖像的認識來選擇標注文字,這樣會使不同的人對圖像的標注不同,而在檢索中會產生很大誤差;(3)不同國家使用的標注文字不同,所以在匹配文字時也會產生很大的偏差;(4)有的圖像里面含有大量的內容,不可能用幾個關鍵字就能表達清楚。為解決標注圖像檢索的缺陷問題。學者著手開展對內容的圖像檢索技術的研究。基于多模態的圖像檢索的改善了此類瓶頸問題,主要從被檢圖像庫根據海量圖像特征進行檢測和匹配,獲取圖像之間的相關性特征信息。

1 基于多模態的圖像特征匹配方法

(1)直接從圖像中尋找匹配線索,而不是通過人為的文字標注,正因為這個特點,突破了傳統的關鍵字標注的耗費人力時間的缺點,而是直接對圖像本身進行處理和分析,使檢索更貼近圖像本身。

(2)檢索可以是人機交互的,當使用一種特征選取方式檢索的結果不能滿足人們的需求時,人們可以人工的改變特征選取方式使檢索結果向于人們需求的方向接近。這樣避免了計算機檢索圖像時的不靈活性,加入了人為的因素。因此,人和計算機結合檢索能使效率和準確率更高。

(3)基于內容的圖像檢索是一種相似性檢索,可以將檢索結果進行相似性排序,我們可以采取逐步求精的算法,不斷減小檢索的范圍,直到定位到準確目標,這與傳統數據庫精確匹配有很大的不同。

由于這些方法,基于多模態內容的圖像檢索漸漸成為人們研究的重點,此類技術可以應用在社會安全、遙感、醫學、數字圖書館、建筑、計算機輔助設計、地理信息系統、商標版權管理、等諸多領域。

2 基于紋理識別的多模態的圖像檢索系統的框架和技術

基于紋理識別的多模態圖像檢索系統組成部分如圖1所示。

(1)輸入模塊:分析和獲取圖像的紋理特征值,并將特征向量輸入圖像特征數據庫。

(2)描述模塊:利用查詢抽象檢索技術,實現將用戶需求抽象提取相關圖像特征語義,并完整描述成計算機能進行識別的特征向量。

(3)檢索模塊:與圖像數據庫的圖像紋理特征值進行相關性匹配,根據機器學習和神經網絡技術,對跨語義的特征向量進行學習和篩選,獲取最符合查詢要求的圖像信息,并返回給用戶。

3 基于圖像紋理特征的檢測方法

圖像有三大底層特征,分別是顏色特征、紋理特征和形狀特征。紋理特征是顯著的視覺特征,其弱化了顏色和亮度的作用,但它吸收了表面結構的排列與組織次序,而且表現出了上下文的關系,反映出了同質再現的視覺特征。

紋理源于人們對物體表面觸感的概念,這種固有的內在特征反映了物體表面的組織結構或者上下文內容的關系等諸多有用的信息,或者反映了圖像像素間的灰度變化情況或者顏色變化情況。組成紋理的基本元素叫作紋元或者紋理基元,是一個觸發視覺感知并且特性相對穩定的基本單元,這些單元在一定的區域內的不同位置會以不同的形態再現,主要是灰度或色彩模式呈現不同特點,其包含多個像素,在物體表面呈現三種:周期性、準周期性或隨機性。

如今,神經網絡、最近鄰分類器、決策樹和支持向量機等模式方法已經廣泛的應用到了許多領域,譬如圖像分類、視頻處理、檢索等。模式類就是由一些共同屬性所決定的,模式分類就是根據對象的特征或屬性進行分類。

按照學習方法的監督程度,也就是根據否存在先驗知識并且是否使用到這些先驗知識,模式分類方法可以分為監督分類和非監督分類。

監督分類對各對象分類的依據是通過訓練樣本,選擇合適的特征參數,以此建立判別函數。監督分類必須要有分類區域的先驗類別知識用以建立判別函數,從而獲得訓練分類器,它把圖像分解為多個組成部分,求解各部分之間的空間關系。一般監督分類在訓練階段需要手工選擇分類區域從而可以確定模型。

在沒有先驗知識情況下,非監督分類能夠有效地分類,是因為其根據圖像像元間的相似度和從分析數據上得到的統計特性,它不需要獲取判別函數集而去進行場地訓練。熟知并且常用的K-means和ISODATA法就是非監督分類方法,也是一種聚類分析方法。這種方法是將圖像視作一些特征的集合,先對這些特征進行聚類分析,得到特征單詞和特征碼,再用統計方法對特征單詞和特征碼進行統計分析,最后根據統計特征進行有效分類。

前面一種分類是根據監督程度來劃分,模式分類方法還可以分為經驗型分類方法和理論型分類方法,此時是根據有無前人分類算法的思想。經驗型方法中比較常用的有最近鄰分類器、RBF網絡和神經網絡等。理論型模式分類算法比較常用的有貝葉斯分類器,支持向量機,這種分類算法數量較少,遠沒有經驗型分類方法多。貝葉斯分類器通過計算樣本概率的差異,將樣本進行分類,但是分布函數的求取較為困難;支持向量機方法SVM基于統計學習理論,在實際應用中取得了一定的成效。

篇7

關鍵詞:計算機專業教育;圖形學;圖像處理;多媒體;教學改革

中圖分類號:TP391,G642 文獻標識碼:A

文章編號:1672-5913 (2007) 24-0080-05

1對圖形圖像與多媒體知識的要求

1.1CC2004知識領域要求

在CC2004中,和圖形圖像與多媒體相關的知識領域是人―機交互(Human-Computer Interaction -HC)、圖形學與可視計算(Graphics & Visual Computing-GV)、信息系統(Information Management -IM)、網絡計算(NetCentric Computing-NC)等幾個部分。表1是CC2004列出的五種課程計劃中所含人―機交互和圖形學與可視計算兩個計算機主題的比重。表中的數字表示對應的專業與相應的知識域的相關性,范圍從0~5。其中,min值表示該學科報告中列舉的學生對相應知識域掌握的典型的最低要求,也是相對于其它專業最低要求的值,max值表示該專業學生對相應知識域掌握的典型的最高要求。

表1 計算機主題的比重

分析CC2004中各課程計劃和表1可得出,CC-CS2001對圖形圖像與多媒體的知識要求最高,所涉及的具體知識單元見表2。

表2 和圖形圖像與多媒體相關的知識單元

CC-CS2001在附錄B的課程描述中,推薦了一些覆蓋知識領域和單元的課程,每門課程里對預備課程、課程提綱、覆蓋的知識單元、各單元學時做了較為詳細的描述。相應地,和圖形圖像與多媒體有關的中介課程有CS250W人機交互和CS255W計算機圖形學等課程,高級課程有CS352圖形用戶接口、CS355高級計算機圖形學、CS356圖像處理等課程,但高級課程只給出課程名稱,還沒有詳細描述。

CS250W人機交互課程要求全面介紹人機交互原理和技術,CS255W計算機圖形學課程則要介紹計算機圖形學的原理和技術,兩門課程覆蓋的知識單元見表3。

表3 CS250W和CS255W的知識單元

1.2CCC2002和教指委計算機科學規范的要求

CCC2002同CC2001一樣,把計算機科學與技術學科的知識體系劃分為知識領域、知識單元和知識點等三個相互關聯的層次結構。完整的本科課程體系結構由三部分組成,即奠定基礎的基礎課程,涵蓋知識體系大部分核心單元的主干課程,用來完備課程體系的特色課程。根據我國計算機科學與技術學科教育的現狀及對典型課程設置的分析,給出了16門課程,分別為計算機導論,程序設計基礎,離散結構,算法與數據結構,計算機組織與體系結構,微型機系統與接口,操作系統,數據庫系統原理,編譯原理,軟件工程,計算機圖形學,計算機網絡,人工智能,數字邏輯,計算機組成基礎,計算機體系結構。在教指委的《計算機科學規范》中,也選取部分知識單元組成了15門核心課程,分別是計算機導論,程序設計基礎,離散結構,算法與數據結構,計算機組成基礎,計算機體系結構,操作系統,數據庫系統原理,編譯原理,軟件工程,計算機圖形學,計算機網絡,人工智能,數字邏輯,社會與職業道德。可見,計算機圖形學都為核心課程之一。

在《計算機科學規范》中,計算機圖形學和可視化計算可以劃分成以下四個相互關聯的領域:

(1) 計算機圖形學:計算機圖形學是一門以計算機產生并在其上展示的圖像作為通信信息的藝術和科學。它有以下幾方面的要求:①表示信息的模型的設計和構建應有助于圖像的產生和觀察;②方便用戶使之能夠通過精心設計的設備和技術與模型(或者說觀察到的圖像)進行交互;③能提供繪制模型的技術;④設計出有助于圖像保存的技術。計算機圖形學的目標是對人類的視覺中心及其他的認知中心有進一步深入的了解;

(2) 可視化技術:主要目標是確定并展示存在于科學的(如計算和醫學科學)和比較抽象的數據集中的基本的相互關聯結構與關系。展示的主要目標則應當是發掘在數據集中潛在的信息,從而有助于用戶增強對它們的理解。雖然,當前的可視化技術主要是探索人類的視覺能力,但是其他的一些感知通道,包括觸覺和聽覺,也均在考慮之中,以便通過它們進一步發現信息的處理過程;

(3) 虛擬現實:虛擬現實(VR)是要讓用戶經歷由計算機圖形學以及可能的其他感知通道所產生的三維環境,提供一種能增進用戶與計算機創建的“世界”交互作用的環境;

(4) 計算機視覺:計算機視覺的目標是推導出一幅或多幅二維圖像所表示的三維圖像世界的結構及性質。對計算機視覺的理解和實踐依賴于計算學科中的核心概念,但也和其他一些學科(如物理、數學、心理學等)密切相關。

CC2004和CCC2002的規范中給出的課程建議規定了每門課程的最小核心內容,包括的這些單元是要獲得學位必須具備的相應知識。核心單元不是課程的全部,核心單元是課程最小的部分,但不能構成完整的本科課程,每門課程應當包括來自知識體系中的附加選修單元。核心單元不能僅安排在本科階段的入門性課程中。許多核心單元屬于入門的導論性知識,但這不意味著它們必須安排在低年級的入門性課程中,因為有些導論性的知識,只有當學生具有必需的基礎知識后才能接受。另外,引論性課程也可以包括選修單元。所以核心這一說法只是意味著必須具備的含義,而并沒有限制它必須安排在那些課程里。

從以上國內外計算機專業推薦的教學計劃和設置的課程可以得到,涉及到圖形圖像與多媒體的內容,一般宜設置計算機圖形學、數字圖像處理、多媒體技術等課程及相關課程,可涵蓋的知識有人―機交互、圖形學、圖像處理、多媒體技術等基礎內容,這樣才可基本達到規范的要求。

2部分高校課程開設情況

從網上可查到的清華大學、上海交通大學、中國科技大學等幾所高校的計算機科學與技術專業本科生培養教學計劃中計算機圖形學、數字圖像處理、多媒體技術等課程設置情況如表4。

表4 涉及圖形圖像與多媒體類課程開設情況

從表4可看到,近幾年在計算機專業里,國內的大學普遍增加了圖形圖像與多媒體類課程的課程數量和教學時間。

3 存在問題及教改研究

3.1問題

篇8

微軟的游戲操控設備 Kinect 有一句廣告語:You are the controller(你就是遙控器)。通過 Kinect,普通人不需要使用任何手柄、搖桿、鼠標或者其他遙控器就能操控游戲,這讓 Kinect 遠遠超越了普通家用游戲機的段位。事實是,人們也沒有把它僅僅當成游戲機,無數黑客對其進行破解,開發出一系列創新發明,有模擬光劍道具,也有自動跟著垃圾跑的垃圾桶,甚至英國一所大學正在基于它研發一種技術幫助中風患者恢復健康。

新的人機交互方式讓計算機能讀懂人所傳遞的命令。現在,眼睛是人們開發的下一個目標。去年底丹麥公司 Senseye 了一個視頻,視頻里,一個人捧著平板電腦在玩“切水果”的游戲——不過,他沒有動一根手指,而是完全用眼神控制。后來,這家由四個丹麥博士生創立的公司改名為“The Eye Tribe”,他們開發的眼控技術能通過智能手機或者平板電腦的前置攝像頭獲取圖像,利用計算機視覺算法進行分析。軟件能定位眼睛的位置,估計你正在看屏幕的什么地方,甚至精確到非常小的圖標。這項眼控技術能夠取代手指,控制平板電腦或手機。據國外媒體報道,他們已經開始與手機制造商和運營商進行合作,希望明年能將正式產品推向市場。

除了用眼神控制手機,用眼睛操控的概念筆記本、眼控相機等產品也已面世。以眼神的移動軌跡為基礎進行的人機交互方式,是繼 Kinect 之后人機交互界面的又一次革命。

眼睛上的實驗

17 世紀初,人們就開始研究眼睛的運動。1879 年,法國人路易斯·艾米·賈維爾觀察到,人們的眼睛在閱讀文字時,并非像之前猜想的是平滑地一行行掃射,而是每隔幾個字就會有短暫的視覺停留。

于是人們很好奇:閱讀時,眼睛會停留在哪些字上?停留多長時間?

為了研究這個問題,埃德蒙·休伊做出世界上第一個眼睛追蹤器:一個有洞的隱形眼鏡,和一個會根據眼睛活動擺動指針的鋁制指示器相連。但這個追蹤器因為要和眼球接觸,對眼睛的干擾比較大。另一個芝加哥的家伙托馬斯·巴斯維爾轉換了思路,做出了一個非接觸式的追蹤器,他利用光束照射眼睛,通過在電影膠片上記錄眼睛反射的光記錄眼睛的活動軌跡。他用這個裝置研究人們閱讀和觀看圖片的行為習慣。

到了 1980 年,眼睛追蹤器被用來研究和人機交互有關的問題;比如,研究人員很好奇用戶如何在電腦菜單中搜索命令。最近幾年,人們越來越多運用眼部追蹤器研究用戶如何和不同的計算機界面互動,結果往往能改變界面的設計。其他的研究包括用戶如何對待下拉菜單,他們通常將注意力集中在網站的什么位置,開發人員就會知道該在哪里設計廣告位。

隨著眼控技術的發展,和人類對視覺生理及心理的了解,基于人類視覺系統(Human Vision System, 簡稱“HVS”)的凝視繪制技術也逐漸成為圖形學的研究熱點。這種技術通過略去不為用戶感知的畫面區域的圖像細節來提高圖像的繪制和顯示效率。

在研究中,人們普遍達成的共識是,“注意力”和眼睛看在哪并不統一,前者總是比眼睛要領先大約 100-250 微秒;也就是說,人的注意力轉移到新的位置 100-250 微秒后,眼睛才會跟隨其后。

在技術上,眼控技術已經相當成熟,在工業控制、機器人學和臨床醫學領域都有應用,只是還沒有應用到消費領域。它是基于角膜反射原理,通過光在用戶眼睛角膜上形成高亮度反射點作為參考點,當眼球轉動注視屏幕上不同位置時,由于眼球近似為球體,光斑不動,瞳孔相對光斑發生偏移,利用瞳孔中心和光斑的位置關系就能確定視線方向。目前運用最廣泛的設計是以視頻為基礎的眼睛追蹤器。一個設想鏡頭聚焦在一只或一雙眼睛上,在觀眾受到某種刺激時記錄它們的變動。眼控技術的核心是算法,如何讓系統迅速準確地“學習”人眼睛的各種行為,這是個挑戰。

EyePhone 應該翻譯成“眼機”或者“目機”?似乎都不太好聽。在大觸屏手機廣泛流行之前,有人就開始研究如何用眼睛控制手機了。

美國達特茅斯學院(Dartmouth College)就有一支眼控手機的研發團隊,他們試圖創造一套眼睛追蹤系統,開發以眼睛來控制手機的操作方法。

讓眼睛追蹤系統運用到操作系統里,重要的是設計一套能夠實現的軟件。首先,你需要校準這個系統,在室內室外不同光線下盯著同一張圖片看,讓軟件學習、識別你的眼睛在不同光照條件下的運動。他們在諾基亞 N810 上做了試驗,設計出一個初始“眼菜單”,屏幕被分為9格,分別對應郵件、接電話、拍照片、日歷、短信等不同功能。當一個人盯著某一塊區域看時,某一個功能區域就被激活高亮顯示,一眨眼,這個功能就被激活。

根據《麻省理工科技評論》雜志 2010 年的報道,眼控式手機的技術研發已經數年。進行這項技術開發的主要目的,是希望能讓手部殘疾的人克服無法使用電話的障礙。

在這項研究中,整個系統技術含量最高的部分就是自動校正系統,它需要算法優化,提高光學采集精度,實現視線跟蹤,適應外部環境光強度變化,判別眼睛睜、閉狀態等。帶領“EyePhone”研發團隊的安德魯·坎貝爾(Andrew Campbel)教授認為,眼控式手機解放了雙手,不僅僅是殘疾人,每個人都能享受到它帶來的極大便利。但靠眼神操作手機,比在桌上的電腦執行眼控指令更困難,因為使用者和手機都是行動中的物體,而周圍環境也是變幻莫測,如何演算和辨識使用者在不同的狀態下所傳達的眼神收發訊號,是最難解決的問題。

在 2011 年的 Cebit 展上,聯想和瑞典眼控技術公司 Tobbi 聯合了一款概念筆記本,特制的長方形感應器能夠追逐眼球的移動軌跡,記錄數據,電腦處理器把這些數據轉化為鼠標控制,整個系統并不會讓眼控的過程感覺十分刻意,也不會像傳統的眼控系統一樣過于敏感或是過于駑鈍。

Tobii 公司成立于 2001 年,是一家專門研發眼動追蹤和眼動控制技術的公司。除了桌面眼動電腦,他們也在研發一款具備眼控界面的 windows 平板電腦 C12,用戶可以轉動眼珠來移動 C12 上的鼠標指針,而眨眼則代表點擊。機器里設置了一個校準界面,允許多個用戶定義眼控指令。

篇9

【關鍵詞】灰度化 RGB HSI HSV

一、引言

彩色攝像機采集的圖像一般是RGB三個顏色通道的模型,即擁有紅(700nm)、綠(546.1nm)、藍(435.8nm)三個分量,這三個分量不同比例的混合,可以得到人類視覺上幾乎全部的色彩信息[1]。但由于該信息占據存儲空間大小灰度化后的三倍,并且三個通道沒辦法按照數學方法進行一些必要的處理(比如邊緣檢測或者二值化),故需將RGB模型處理成為一種新的色彩通道,該模型只有一個色彩通道,可以令R=G=B,這樣原本用三個通道的信息,便轉化為一個叫做灰度的值,而這個值的范圍同樣是0~255,并且可以直觀地認為,該數字表示圖像上色彩的亮度。由于彩色光(RGB混合)同一波長有可能對應不同的混合顏色,所以我們又定義了色調、飽和度、明度的概念。色調用于標識顏色,如果顏色可以用單一色光和白光按照一定比例配合,則這個顏色的色調用此單一色光的波長表示,若非單色光和白光按照比例合成,則這個顏色的色調用此非單色光的補光表示[2]。飽和度用以表示顏色的純潔程度,明度用于表示顏色的明亮程度。要提取亮度分量,需要用到HSV和HSL模式。HSV由色調、飽和度、純度表示顏色。HSL則由色調、飽和度、亮度三個通道構成,是目前應用最多的色彩模式之一[3~4]。灰度化一般可以采取RGB分量、HSL分量、HSV分量、HSI分量等方式。

二、 灰度化原理

(一)RGB分量法:將RGB空間中的R分量、G分量或B分量提取出來稱為強度信號,變為所要的圖形。

(二)HSL分量法:將RGB空間按公式轉換為HSL空間,然后分別提取H、S、L分量[5]。

(三)HSV分量法:將RGB空間按公式轉換為HSV空間,然后分別提取H、S、L分量。

(四)HSI分量法:人的視覺系統經常采用HSI色彩空間,它比RGB色彩空間更符合人的視覺特性。在圖像處理和計算機視覺中大量算法都可在HSI色彩空間中方便地使用,它們可以分開處理而且是相互獨立的。因此,在HSI色彩空間可以大大簡化圖像分析和處理的工作量。

三、灰度化的實現

四、總結

本文介紹了幾種圖像灰度化的方法,并用LABVIEW編程實現了,仿真結果表明對于不同的圖像應該針對圖像本身采用相應的灰度化方法。

參考文獻:

[1]郝建青,張仲義,陳濱.基于車輛實時跟蹤的編組站綜合自動化系統集成方案的研究[J].鐵道學報,2000,(2):1-6.

[2]徐杰民,肖云.二維條碼技術現狀及發展前景[J].計算機與現代化,2004,(12):141-142.

[3]張聰,張慧.復雜背景下維條碼圖像的提取[J].微計算機信息,2007,23(10):302-304.

[4]霍宏濤,林小竹,何薇.數字圖像處理[M].北京:北京理工大學出版社,2003.

[5]劉紅霞.圖像分割算法的研究與實現[D].上海:華東師范大學,2004.

作者簡介:

篇10

Linear Algebra Tools for Data Mining

2012,880 p

Hardcover

ISBN9789814383493

Dan A Simovici著

隨著大數據時代的到來,數據挖掘技術逐漸走向了應用的前臺。從文本檢索到社交關系挖掘,從計算機視覺到語音識別,從推薦系統到網絡安全,眾多應用領域都需要數據挖掘技術的支撐。而隨著數據規模的膨脹,數據挖掘技術也面臨著如何提高效率、提高可擴展性的挑戰。為此科學家們提出很多解決思路,其中基于矩陣計算或線性代數的數據挖掘技術因其易于并行化且計算效率相對較高等優勢而受到研究人員的青睞。而對于計算機科學或者工科計算技術的教材來說,一般只對線性代數的理論和技術進行講解,很少能與實際應用進行結合。本書的目的就是希望彌補這一空白,把傳統的線性代數內容與最新的數據挖掘技術結合在一起展示給人們。

本書分為線性代數理論部分和數據挖掘應用部分,共包含16章。線性代數部分,含第1-10章:1.通過基本代數結構的建立引入線性空間;2.矩陣的概念;3.MATLAB的基本編程;4.行列式;5.線性空間中的范式;6.內積空間;7.凸性;8.特征值;9.相似和譜;10.矩陣的SVD(奇異值分解)。第2部分講解了線性代數在數據挖掘中的應用,含第11-16章:11.矩陣在圖中的應用;12.數據采樣矩陣;13.最小二乘近似和數據挖掘;14.維度約減技術;15.kMeans聚類;16.圖的譜和譜聚類。

本書非常好地把線性代數和數據挖掘結合起來進行介紹,使得科研人員不僅能深化對于矩陣和線性代數理論的認識,又可以從應用中理解各種方法的作用。本書的作者Dan A Simovici教授是馬薩諸塞波士頓大學計算機科學系的教授,多年來致力于將基本數學理論與數據挖掘技術相結合的教學研究工作。他目前還在撰寫另一本圖書《數據挖掘的數學工具(Mathematical Tools for Data Mining)》,預計2014年會由Springer出版。本書非常適合在讀研究生和相關科研人員閱讀。

張志斌,副研究員

(中國科學院計算技術研究所)