對(duì)計(jì)算機(jī)視覺的理解范文

時(shí)間:2023-12-22 18:02:34

導(dǎo)語:如何才能寫好一篇對(duì)計(jì)算機(jī)視覺的理解,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公文云整理的十篇范文,供你借鑒。

對(duì)計(jì)算機(jī)視覺的理解

篇1

關(guān)鍵詞:國庫集中支付制度 高校 預(yù)算管理

在我國財(cái)政預(yù)算管理改革中,國庫集中支付制度是一個(gè)非常重要的內(nèi)容,它是我國在財(cái)政改革中的一項(xiàng)重大舉措。所謂國庫集中支付制度就是政府將所有財(cái)政性資金統(tǒng)一納入國庫單一賬戶體系管理中,所得的收入直接繳入國庫或財(cái)政專戶,支出時(shí)通過國庫單一賬戶體系支付到商品和勞務(wù)供應(yīng)者或用款單位。目前,國庫集中支付制度逐漸進(jìn)入到了高校中,并且開始全面實(shí)施,這給高校的預(yù)算管理產(chǎn)生了非常大的影響,新形勢(shì)下怎樣對(duì)預(yù)算管理工作進(jìn)行完善與加強(qiáng)是高校面臨的一個(gè)重要問題。

一、國庫集中支付制度下對(duì)高校預(yù)算管理的影響

國庫集中支付制度在高校全面實(shí)施以后,財(cái)政資金不再直接下?lián)艿礁咝#怯筛咝8鶕?jù)財(cái)政部門審核通過的部門預(yù)算編制用款計(jì)劃,報(bào)經(jīng)財(cái)政部門批復(fù)后,根據(jù)批復(fù)的計(jì)劃,在這個(gè)計(jì)劃之內(nèi)以財(cái)政授權(quán)支付以及財(cái)政直接支付兩種方式來對(duì)資金進(jìn)行使用,而不是以前的將財(cái)政資金直接下?lián)艿礁咝V小_@就給高校預(yù)算編制提出了更高要求,對(duì)高校預(yù)算管理產(chǎn)生了重要影響。

(一)預(yù)算編制趨于科學(xué)與準(zhǔn)確

我國實(shí)行國庫集中支付制度以后,財(cái)政依照實(shí)際支付數(shù)反映支出,對(duì)于一些專項(xiàng)經(jīng)費(fèi)以及人頭經(jīng)費(fèi)則是直接支付,高校不能隨意把項(xiàng)目與用途進(jìn)行改變,這就要求高校及其下屬單位必須如實(shí)申報(bào)用款計(jì)劃,建立科學(xué)合理的預(yù)算定額和指標(biāo)體系,最大可能對(duì)預(yù)算予以細(xì)化,讓學(xué)校所有的財(cái)政性資金的支付都能以明細(xì)預(yù)算為前提,對(duì)年度支出進(jìn)行一個(gè)詳細(xì)安排,從本質(zhì)上讓學(xué)校預(yù)算編制趨于科學(xué)和準(zhǔn)確。

(二)預(yù)算執(zhí)行趨于嚴(yán)肅與合理

在國庫集中支付制度下,必須提出一個(gè)比較詳盡的論證報(bào)告以及預(yù)期效益才能實(shí)施專項(xiàng)經(jīng)費(fèi),預(yù)算執(zhí)行與財(cái)政資金的實(shí)際支出在時(shí)間上一致,這樣可以從源頭上促使單位按預(yù)算規(guī)定執(zhí)行,避免亂挪亂用財(cái)政資金的現(xiàn)象發(fā)生,預(yù)算單位所要支付的每一筆資金的具體使用情況都可以進(jìn)行全過程監(jiān)控,有效提升了財(cái)政資金運(yùn)轉(zhuǎn)的透明度,增強(qiáng)了監(jiān)管力度,預(yù)算執(zhí)行逐漸趨于嚴(yán)肅與合理。

(三)預(yù)算管理趨于規(guī)范與高效

在傳統(tǒng)的預(yù)算管理中,多頭開設(shè)賬戶普遍存在于各個(gè)高校中,造成預(yù)算內(nèi)轉(zhuǎn)預(yù)算外以及賬外賬等情況的發(fā)生,這不但使資金管理混亂不堪以及效率低下,還極容易引發(fā)腐敗。在國庫集中支付制度下,高校對(duì)現(xiàn)有的預(yù)算編制、銀行清算制度、收付程序以及預(yù)算執(zhí)行等進(jìn)行了不同程度的修改,建立起了統(tǒng)一的預(yù)算資金申請(qǐng)和撥付體系,對(duì)預(yù)算資金的管理和使用進(jìn)行了更進(jìn)一步的監(jiān)督約束,預(yù)算管理逐漸趨于規(guī)劃與高效。

二、高校預(yù)算管理中存在的問題

(一)對(duì)預(yù)算管理不夠重視

受長(zhǎng)期以來預(yù)算管理不嚴(yán)格以及制度不健全的影響,一些高校部門負(fù)責(zé)人對(duì)國庫集中制度下的預(yù)算管理不夠重視。在實(shí)施預(yù)算編制時(shí),只是被動(dòng)接受下達(dá)的預(yù)算指標(biāo),不能把各個(gè)部門理財(cái)?shù)姆e極性充分調(diào)動(dòng)起來。許多高校在申報(bào)預(yù)算程序時(shí)不夠明確,預(yù)算編制主要由財(cái)務(wù)部門個(gè)別人員參與,預(yù)算數(shù)據(jù)也只是在往年的開支基礎(chǔ)上進(jìn)行簡(jiǎn)單的加減,編制預(yù)算成為“數(shù)字游戲”,甚至有的高校在財(cái)務(wù)上仍實(shí)行“報(bào)賬式”的管理模式,這就讓學(xué)校的發(fā)展規(guī)劃和資金供給嚴(yán)重不符。

(二)預(yù)算信息系統(tǒng)不夠完善

在部門預(yù)算、國庫單一以及政府采購賬戶實(shí)行以后,許多高校的預(yù)算軟件沒有和以往使用的會(huì)計(jì)賬務(wù)管理軟件進(jìn)行聯(lián)網(wǎng),政府采購、國庫支付以及部門預(yù)算三個(gè)軟件比較單一,不能從根本上實(shí)現(xiàn)數(shù)據(jù)的共享。

(三)實(shí)行的編制方法不夠科學(xué)

目前,許多高校的預(yù)算編制方法都采用傳統(tǒng)的增量預(yù)算,也就是在確定年度預(yù)算的時(shí)候以上一年的實(shí)際支出為基礎(chǔ),在這個(gè)基礎(chǔ)上考慮下一年度財(cái)政收支的各種因素變化。此方法簡(jiǎn)單而且易行,但是很容易形成一個(gè)剛性支出,對(duì)支出數(shù)額以及支出結(jié)構(gòu)的調(diào)整與優(yōu)化有著不良的影響。又由于基數(shù)中包含有許多不科學(xué)以及不合理的因素,用增量預(yù)算方法編制的預(yù)算只能是一年一年增加,資金的供需矛盾被加劇,預(yù)算中的平均主義會(huì)滋長(zhǎng)出來。

(四)編制范圍不夠完整

當(dāng)前,許多高校的資金逐漸呈現(xiàn)出多元化現(xiàn)象,學(xué)校中的各個(gè)院系以及各個(gè)部門通過多渠道創(chuàng)收的資金收入和有關(guān)的支出都沒有全部納入到預(yù)算當(dāng)中,與預(yù)算管理相脫離,相關(guān)的主管部門對(duì)學(xué)校專項(xiàng)經(jīng)費(fèi)撥款不確定,不能很好的在年初部門預(yù)算中反映,只能實(shí)行在年中進(jìn)行追加的方式,尤其是對(duì)項(xiàng)目的確立比較滯后,預(yù)算指標(biāo)不能及時(shí)進(jìn)行下達(dá),導(dǎo)致預(yù)算內(nèi)容不健全,預(yù)算不完整,收支的口徑和核算的口徑出現(xiàn)偏差,對(duì)預(yù)算執(zhí)行的有效考核缺乏一個(gè)可比性。

三、加強(qiáng)高校預(yù)算管理的措施

(一)更新管理觀念

在國庫集中支付制度下,高校在預(yù)算中要積極更新管理觀念,把各個(gè)部門參與預(yù)算管理的積極性給充分調(diào)動(dòng)起來。其一,高校財(cái)務(wù)部門要改變過去的僅看重分配的舊觀念,要積極將預(yù)算轉(zhuǎn)變?yōu)檫^程管理,在實(shí)施過程中對(duì)學(xué)校中的每一項(xiàng)預(yù)算都要進(jìn)行全過程管理,把預(yù)算的事前控制作用突顯出來,讓預(yù)算逐漸向微觀管理層次遞進(jìn)。其二,要注重以人為本和廣泛參與意識(shí)。在高等學(xué)校中,預(yù)算管理就似“一盤棋”,需要各個(gè)部門之間的相互協(xié)調(diào)、相互配合以及及時(shí)溝通,為預(yù)算管理的良好方法提出意見,避免因?yàn)橹黧w和客體之間交流不足而出現(xiàn)預(yù)算管理的負(fù)面效應(yīng)情況發(fā)生。

(二)健全管理系統(tǒng)

為了使高校預(yù)算編制更加準(zhǔn)確與合理,就必須對(duì)預(yù)算編制基礎(chǔ)數(shù)據(jù)的搜集以及整理工作進(jìn)行加強(qiáng),用現(xiàn)代科學(xué)技術(shù)為部門預(yù)算提供必要的信息保障,增強(qiáng)預(yù)算管理的信息化。各個(gè)高校要整合現(xiàn)有的應(yīng)用系統(tǒng),建立一個(gè)綜合性的信息平臺(tái),將以往的預(yù)算系統(tǒng)單機(jī)版改為網(wǎng)絡(luò)版,對(duì)預(yù)算指標(biāo)管理、專項(xiàng)支出項(xiàng)目庫、管理預(yù)算基礎(chǔ)信息、預(yù)算執(zhí)行檢測(cè)分析以及預(yù)算編制審查等工作進(jìn)行合理統(tǒng)籌,在網(wǎng)絡(luò)上將各項(xiàng)預(yù)算數(shù)據(jù)與執(zhí)行情況進(jìn)行,控制人員可以隨時(shí)進(jìn)行調(diào)用,對(duì)預(yù)算的執(zhí)行情況和財(cái)務(wù)狀況進(jìn)行查詢,對(duì)各責(zé)任單位的業(yè)務(wù)活動(dòng)實(shí)行全面控制,發(fā)現(xiàn)問題及時(shí)解決,對(duì)預(yù)算執(zhí)行時(shí)出現(xiàn)的偏差進(jìn)行糾正。

(三)嚴(yán)格編制程序

高校在預(yù)算管理中要做到公開、公平和公正,對(duì)于一些重大的項(xiàng)目要由專門的機(jī)構(gòu)進(jìn)行論證,杜絕那些“小頭大尾”工程的出現(xiàn),對(duì)教育資源造成很大浪費(fèi)。在對(duì)預(yù)算進(jìn)行編制時(shí),各個(gè)高??梢园蚜慊?、滾動(dòng)和彈性等預(yù)算法有效結(jié)合起來,把預(yù)算主體的活動(dòng)和目標(biāo)及趨勢(shì)融合在一起,使編制的預(yù)算能夠在以效益為中心的基礎(chǔ)上具有現(xiàn)實(shí)性以及可行性。對(duì)年度為單位的預(yù)算要運(yùn)用零基預(yù)算式的編制方式。對(duì)于那些比較長(zhǎng)遠(yuǎn)的預(yù)算,則應(yīng)用彈性預(yù)算式的編制方式。

(四)健全管理機(jī)制

在高校中,預(yù)算管理機(jī)制由評(píng)價(jià)、激勵(lì)、控制以及決策組成。所謂預(yù)算管理的評(píng)價(jià)機(jī)制就是當(dāng)預(yù)算活動(dòng)結(jié)束以后,要對(duì)預(yù)算執(zhí)行的結(jié)果進(jìn)行評(píng)價(jià),為以后的預(yù)算管理制定提供一個(gè)良好信息;對(duì)于激勵(lì)機(jī)制就是運(yùn)用不同的激勵(lì)手段把管理主體的行為動(dòng)機(jī)激發(fā)出來,調(diào)動(dòng)他們的積極性與主動(dòng)性;控制機(jī)制在預(yù)算管理中不可或缺,它是依照預(yù)算目標(biāo)的要求來對(duì)預(yù)算績(jī)效的標(biāo)準(zhǔn)進(jìn)行確定和衡量,將實(shí)際的執(zhí)行情況和預(yù)算標(biāo)準(zhǔn)進(jìn)行比較,確定預(yù)算執(zhí)行時(shí)出現(xiàn)的偏差,在這個(gè)基礎(chǔ)上進(jìn)行調(diào)節(jié);預(yù)算管理決策機(jī)制是核心,它主要目的就是通過科學(xué)而又合理的決策,對(duì)預(yù)算目標(biāo)做出正確合理的規(guī)劃。

(五)提高綜合素質(zhì)

高校的財(cái)務(wù)人員要加強(qiáng)學(xué)習(xí),掌握預(yù)算運(yùn)作情況,提高發(fā)現(xiàn)問題、總結(jié)問題以及解決問題的能力,為良好的預(yù)算管理打好基礎(chǔ)。要注重去社會(huì)上學(xué)習(xí)新的知識(shí)和好的經(jīng)驗(yàn),各個(gè)高校之間要互動(dòng)交流,逐漸探求預(yù)算管理的有效方法,通過這種互動(dòng)交流,不但開闊了認(rèn)知視野,還可以學(xué)到優(yōu)秀的管理經(jīng)驗(yàn)。同時(shí),高校的財(cái)務(wù)人員要重視觀念的更新,把專業(yè)知識(shí)與財(cái)務(wù)管理結(jié)合起來,發(fā)揮自身的參謀作用,實(shí)現(xiàn)從傳統(tǒng)的核算型會(huì)計(jì)到管理型會(huì)計(jì)的轉(zhuǎn)變。

四、結(jié)語

我國實(shí)行國庫集中支付制度,改變了過去傳統(tǒng)的資金管理方式,是財(cái)政資金的全新模式,具有比較強(qiáng)的行業(yè)特征以及獨(dú)立性,這就讓具有自身行業(yè)特點(diǎn)的高校財(cái)政部門面臨著很大挑戰(zhàn),會(huì)計(jì)業(yè)務(wù)更加繁多復(fù)雜,廣大高校只有明確方向,積極溝通,在實(shí)踐中進(jìn)行探究,逐步完善校內(nèi)的預(yù)算管理制度,才能真正適應(yīng)國庫集中支付制度的改革,也才能促進(jìn)高等教育事業(yè)的健康、穩(wěn)步發(fā)展。

參考文獻(xiàn):

[1] 孫惠娟.國庫集中支付制度改革研究[J].行政事業(yè)資產(chǎn)與財(cái)務(wù),2013(01)

[2] 姜亞萍.淺談國庫集中支付制度下教育系統(tǒng)內(nèi)部審計(jì)的對(duì)策[J].財(cái)經(jīng)界,2013(02)

[3 朱生明,張彩玲,王瑛.對(duì)推進(jìn)國庫集中支付制度改革的幾點(diǎn)思考[J].財(cái)會(huì)研究,2012(23)

篇2

關(guān)鍵詞:計(jì)算機(jī)視覺;案例推理;圖像處理;圖像描述

中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2007)04-11102-03

1 引言

基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項(xiàng)重要推理技術(shù)?;诎咐评砼c類比推理方法相似,案例推理將舊經(jīng)驗(yàn)或教訓(xùn)轉(zhuǎn)換為知識(shí),出現(xiàn)新問題時(shí),首先查找以前是否有相似的案例,并用相似案例解決新問題。如果沒遇到相似案例的,經(jīng)過推理后解決新問題的方法,又會(huì)成為新的案例或新經(jīng)驗(yàn),下一次再遇到相同問題時(shí),就可以復(fù)用這些案例或經(jīng)驗(yàn)。

這與人遇到問題時(shí),首先會(huì)用經(jīng)驗(yàn)思考解決問題的方式相似,這也是解決問題較好的方法?;诎咐评響?yīng)用于工業(yè)產(chǎn)品檢測(cè)或故障診斷時(shí)具有以下特點(diǎn):

CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識(shí),以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。

CBR較好解決“知識(shí)獲取”的瓶頸。CBR知識(shí)表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡(jiǎn)化知識(shí)獲取的過。

CBR求解效率較高。是對(duì)過去的求解結(jié)果進(jìn)行復(fù)用,而不是再次從頭開始推導(dǎo),可以提高對(duì)新問題的求解效率。

CBR求解的質(zhì)量較高。CBR以過去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時(shí)該怎樣走向成功或避開失敗。

CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來問題的解決。

所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測(cè)和設(shè)備故障診斷方面,并取得較好的經(jīng)濟(jì)效益。為了產(chǎn)品檢測(cè)和設(shè)備故障診斷中,更為智能化,更容易實(shí)現(xiàn)現(xiàn)場(chǎng)檢測(cè)和診斷,計(jì)算機(jī)視覺技術(shù)起到很大的作用。

計(jì)算機(jī)視覺是研究用計(jì)算機(jī)來模擬人和生物的視覺系統(tǒng)功能的技術(shù)學(xué)科,使計(jì)算機(jī)具有感知周圍視覺世界的能力。通過計(jì)算機(jī)視覺,進(jìn)行圖像的獲取預(yù)處理、圖像分割與特征抽取、識(shí)別與分類、三維信息理解、景物描述、圖像解釋,讓計(jì)算機(jī)具有對(duì)周圍世界的空間物體進(jìn)行傳感、抽象、判斷的能力,從而達(dá)到識(shí)別、理解的目的。

計(jì)算機(jī)視覺隨著科學(xué)技術(shù)發(fā)展,特別計(jì)算機(jī)技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計(jì)算機(jī)視覺理論的不斷發(fā)展和日趨成熟,使計(jì)算機(jī)視覺從上世紀(jì)60年代開始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡(jiǎn)單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運(yùn)動(dòng),由二維轉(zhuǎn)向三維,并主要著眼于對(duì)圖像的識(shí)別和理解上,也使計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運(yùn)用計(jì)算機(jī)視覺打下基礎(chǔ)。

2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)

(1)案例的表示與組織

案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計(jì)算機(jī)中組織存儲(chǔ)。如何將信息抽取出特征變量,選擇什么語言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲(chǔ)器中,這關(guān)系到基于案例推理方法的效率,而且對(duì)于案例數(shù)量越來越多,結(jié)構(gòu)十分復(fù)雜的案例庫,尤其重要。

(2)案例的索引與檢索

案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。

(3)案例的復(fù)用和調(diào)整

案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問題之間的不同之處,案例中的哪些部分可以用于新問題,哪些部分不適合應(yīng)用于新問題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。

(4)案例的學(xué)習(xí)

案例的學(xué)習(xí)即是將新解添加到案例庫中,擴(kuò)充案例庫的案例種類與數(shù)量,這過程也是知識(shí)獲取。此過程涉及選取哪些信息保留,以及如何把新案例有機(jī)集成到案例庫中,包括如何存儲(chǔ),如何建立索引等等。

針對(duì)案例推理的關(guān)鍵技術(shù),根據(jù)檢測(cè)和故障診斷系統(tǒng)的特點(diǎn),計(jì)算機(jī)視覺主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進(jìn)行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進(jìn)行案例建模,確立案例的表示形成和案例相似度的計(jì)算。本文主要從計(jì)算機(jī)視覺如何運(yùn)用在案例推理系統(tǒng)進(jìn)行探討。

3 產(chǎn)品輸入系統(tǒng)

產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。

圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)

傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進(jìn)行圖像采集,是否繼續(xù)下一個(gè)產(chǎn)品圖像的采集。這簡(jiǎn)單傳感器可使用光電開關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過時(shí),產(chǎn)品遮擋住光源,使光電開關(guān)產(chǎn)生一個(gè)0值,而沒有產(chǎn)品經(jīng)過時(shí),光電開關(guān)產(chǎn)生相反的1值,系統(tǒng)通過判斷光電開關(guān)的值,從而判斷是否有產(chǎn)品。

圖像采集單元簡(jiǎn)單地說是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機(jī)和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機(jī)主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測(cè)件上,CCD相機(jī)拍攝,拍攝圖像經(jīng)過圖像采集卡數(shù)字化后輸入存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備即為計(jì)算機(jī)硬盤。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。

這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。

4 圖像處理

在案例推理系統(tǒng)中,需要對(duì)案例的組織和案例建模,案例的組織即案例的表示,相對(duì)計(jì)算機(jī)而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有唯一性。同時(shí),又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、唯一性、操作容易性。

圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點(diǎn),確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對(duì)產(chǎn)品輸入的原始圖像進(jìn)行處理。

在計(jì)算機(jī)視覺技術(shù)中,對(duì)原始圖像主要進(jìn)行圖像增強(qiáng)、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。具體工作流程如圖2所示:

圖2 計(jì)算機(jī)視覺的任務(wù)與工作流程

圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計(jì)算機(jī)后,首先要進(jìn)行圖像的預(yù)處理,主要完成對(duì)圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。

圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來分割目標(biāo)和背景。

圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。

圖像邊緣提取是為了將圖像中有意義的對(duì)象與其背景分開,并使之具有某種指定的數(shù)學(xué)或符號(hào)表達(dá)形式,使計(jì)算機(jī)能夠理解對(duì)象的具體含義,檢測(cè)出邊緣的圖像就可以進(jìn)行特征提取和形狀分析了。可采用多種算法,如采用Sobel算子提取邊緣。

圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測(cè)診斷的效率。

特征提取是對(duì)圖像進(jìn)行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒有特征,就談不上進(jìn)行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進(jìn)行描述,形成計(jì)算機(jī)中屬性值,并從數(shù)據(jù)庫查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。

5 系統(tǒng)的檢索

根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。

圖3 案例推理系統(tǒng)

對(duì)話系統(tǒng):完成人機(jī)交互、問題描述、結(jié)果顯示和系統(tǒng)總控制。

案例庫系統(tǒng):由案例庫及案例庫管理系統(tǒng)組成。

數(shù)據(jù)析取系統(tǒng):對(duì)各種已有的源數(shù)據(jù)庫的數(shù)據(jù)通過轉(zhuǎn)換而形成所需的數(shù)據(jù)。

多庫協(xié)同器:根據(jù)問題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問題求解過程中對(duì)模型庫系統(tǒng)、方法庫系統(tǒng)、知識(shí)庫系統(tǒng)和數(shù)據(jù)庫系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。

知識(shí)庫系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識(shí)包括專家經(jīng)驗(yàn)和以規(guī)則形式表示的有關(guān)知識(shí),也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫系統(tǒng):由模型庫、算法庫、模型庫管理系統(tǒng)組成。完成模型識(shí)別和調(diào)用,并把結(jié)果綜合,送入對(duì)話系統(tǒng)顯示,作為補(bǔ)充信息供案例檢索、調(diào)整使用。

數(shù)據(jù)庫系統(tǒng):存放待決策支持的所有問題,并完成其維護(hù)與查詢等功能。

由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)監(jiān)控或故障診斷,所以系統(tǒng)的檢索時(shí),也必須輸入檢索值,即輸入現(xiàn)場(chǎng)產(chǎn)品的圖像,在通過產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進(jìn)行圖像特征描述,根據(jù)圖像描述進(jìn)行分類識(shí)別。根據(jù)案例推理的算法檢索案例庫中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進(jìn)行決策。如產(chǎn)品質(zhì)量檢測(cè),確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。

6 結(jié)論

案例推理方法有效地解決計(jì)算機(jī)視覺技術(shù)中圖像檢索問題。對(duì)提高圖像檢索的效率和準(zhǔn)確度提供了平臺(tái)。

計(jì)算機(jī)視覺技術(shù)也為案例推理系統(tǒng)實(shí)現(xiàn)產(chǎn)品現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)、監(jiān)控、診斷提供技術(shù)支持。計(jì)算機(jī)視覺技術(shù)現(xiàn)場(chǎng)的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。

兩者的結(jié)合設(shè)計(jì)的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進(jìn)行質(zhì)量檢測(cè)、監(jiān)控,或設(shè)備需要進(jìn)行故障診斷和維護(hù),都可以適用。

系統(tǒng)提供的實(shí)時(shí)檢測(cè)、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。

參考文獻(xiàn):

[1](美)桑肯(Sonka,M).圖像處理分析與機(jī)器視覺[M].人民郵電出版社.

[2]王宏等譯.計(jì)算機(jī)視覺[M].電子工業(yè)出版社.

[3]蔡建榮.自然場(chǎng)景下成熟水果的計(jì)算機(jī)視覺識(shí)別[J].農(nóng)業(yè)機(jī)械,36(2):61-64.

[4]王宇輝.基于計(jì)算機(jī)視覺的錐體零件尺寸在線檢測(cè)算法[J].重型機(jī)械,2005,2:4-6

[5]駱志堅(jiān).基于計(jì)算機(jī)視覺檢測(cè)技術(shù)自動(dòng)計(jì)數(shù)系統(tǒng)的研究與應(yīng)用[J].儀表技術(shù)與傳感器,2005,3:41-43.

[6]左小德.貼近度分析法在案例庫推理中的應(yīng)用[J],南大學(xué)學(xué)報(bào)(自然科學(xué)版),1997,18(1):21-26.

[7]姜麗紅.案例推理在智能化預(yù)測(cè)支持系統(tǒng)中的應(yīng)用研究[J].決策與決策支持系統(tǒng),1996,6(4):63-69.

篇3

關(guān)鍵詞:計(jì)算機(jī)數(shù)字技術(shù);虛擬現(xiàn)實(shí);視覺文化;時(shí)代影像;觀察模仿與建構(gòu)

“計(jì)算機(jī)是形而上學(xué)的實(shí)驗(yàn)室”――哲學(xué)家海姆說。

大部分的知識(shí)與經(jīng)驗(yàn),我們都是從視覺經(jīng)驗(yàn)中去獲取。視覺,作為第一感官,讓視覺文化的發(fā)展史成為人類文明史很重要的部分。所以視覺技術(shù)的發(fā)展和變化也必將對(duì)文化產(chǎn)生深刻的影響。

隨著視覺技術(shù)的發(fā)展也相應(yīng)改變了人們看的方式,看的方式的改變也將反過來作用于人們的認(rèn)識(shí)。計(jì)算機(jī)視覺技術(shù)作為一種現(xiàn)代社會(huì)最重要的新媒介,必然也將影響和擴(kuò)展無數(shù)的可能性。

一、技術(shù)革新與觀察方式的變化

(一)原始的觀察方式

視覺作為一種可以有效感知形體及色彩節(jié)奏變化、可以較為穩(wěn)定保存與傳播的感官形式,成為了人類文明的重要載體。但視覺也受到空間范圍和錯(cuò)覺現(xiàn)象等因素的影響,劃定了它所存在的局限性。于是人們不再僅僅滿足于這種單純的看,而希望和渴望視覺的無限延伸,“千里眼”的神話就是體現(xiàn)了人類這種希望拓展視覺能力很好的例子。

(二)技術(shù)革新下的觀察方式

“千里眼”的神話不是遙不可及。望遠(yuǎn)鏡的發(fā)明,極大的擴(kuò)展了人類視覺空間范圍,最終在這種外在視覺輔助工具的幫助下從新發(fā)現(xiàn)和認(rèn)識(shí)了這個(gè)世界。除了這種拓展視覺空間的外在設(shè)備,還有對(duì)于視覺成像形式發(fā)生改變的視覺技術(shù)。從三菱鏡對(duì)于不同可視光線的發(fā)現(xiàn)再到x射線,紅外線夜視設(shè)備等都大大拓展了肉眼的可視領(lǐng)域,我們可以觀察到紅外線等特殊光線。

二、計(jì)算機(jī)視覺技術(shù)下建構(gòu)虛擬現(xiàn)實(shí)

(一)什么是虛擬現(xiàn)實(shí)

英國的克里斯托弗.霍洛克斯在其《麥克盧漢與虛擬實(shí)在》一書中對(duì)于“虛擬性”這一概念作了比較明確的界定:虛擬性又兩層涵義,一是虛擬作為科技的虛擬效果,一是虛擬文本所帶來的虛擬實(shí)在。第一層含義是這篇文章重點(diǎn)討論的,且計(jì)算機(jī)視覺技術(shù)是怎么實(shí)現(xiàn)這種虛擬效果的。一般我們所說的“虛擬現(xiàn)實(shí)”主要是指電腦虛擬環(huán)境,這和“虛擬性”是有概念上的差別的,不僅僅“虛擬實(shí)在”具有“虛擬性”,而我們由很多的形式據(jù)有“虛擬性”。而怎么界定什么就是“虛擬實(shí)在”,什么又不足以構(gòu)成虛擬實(shí)在?蘭尼爾認(rèn)為這種“虛擬實(shí)在”得以體現(xiàn)需要“沉浸”(immersion)“交互作用”(interaction)和信息的“密集度”(intensity)三者對(duì)于“虛擬”的作用程度。“沉浸”的感覺“來自某些設(shè)備,他們將完全將人們的感官隔離開來,讓人覺得從一個(gè)地方移到另一處”,信息的“密集度”的界定取決于虛擬性能給用戶提供什么樣的信息構(gòu)建,尤其是關(guān)于自身處境是否真實(shí)程度的信息。所以對(duì)于“沉浸”“信息密集度”三者作用于人的程度就是衡量是否實(shí)現(xiàn)虛擬實(shí)在的重要標(biāo)準(zhǔn)。

(二)計(jì)算機(jī)視覺技術(shù)對(duì)“虛擬實(shí)在”實(shí)現(xiàn)的影響

1.計(jì)算機(jī)視覺技術(shù)對(duì)于“沉浸”現(xiàn)象的影響

首先對(duì)于“沉浸”蘭尼爾提到“來自某種設(shè)備”“他們完全將人們的感官隔離開來”“讓人感覺從一個(gè)地方移到另一個(gè)地方”。其實(shí)單純的理解“沉浸”的這種狀態(tài),會(huì)發(fā)現(xiàn)在人們生活中就會(huì)經(jīng)常有所體驗(yàn)。繪畫可以實(shí)現(xiàn)沉浸對(duì)于視覺的要求,但是繪畫所營造的視覺感受不管再寫實(shí)也不如攝影影像來的真實(shí),而我們更要注意到的是繪畫也好攝影圖片也好都是相對(duì)靜止的畫面,這樣很容易隨時(shí)讓我們從沉浸的虛擬環(huán)境中看見不真實(shí),從而破壞這種沉浸。而電影用時(shí)間幀將靜止的畫面實(shí)現(xiàn)了運(yùn)動(dòng),而且因?yàn)橐晥D像的可組合排列的特點(diǎn),實(shí)現(xiàn)了對(duì)于情節(jié)視覺圖像的編排的可能性,我們甚至就可以感覺時(shí)間就從我們身邊穿過,完成了對(duì)于深度“沉浸”的實(shí)現(xiàn)。

2.“信息密集度”與計(jì)算機(jī)視覺技術(shù)的關(guān)系

計(jì)算機(jī)作為現(xiàn)代最偉大的發(fā)明,依靠“0”“1”的運(yùn)算模式,從某種意義上來說突破了“形式”與“內(nèi)容”的不完全一致性,比如計(jì)算機(jī)如果要想改變外在的圖像元素,就必然要改變內(nèi)在的程序模式,如果一旦改變了其內(nèi)在的程序也必然導(dǎo)致外在圖像元素的改變。計(jì)算機(jī)視覺技術(shù)正隨著計(jì)算機(jī)處理能力的提升,飛速地發(fā)展著,這樣處理信息的密度越大,計(jì)算機(jī)處理圖像的質(zhì)量就越高,所以可以達(dá)到的“沉浸”和“交互作用”就越強(qiáng)烈,視覺、聽覺等感官所感知真實(shí)的可能性被大大減小,所以“信息的密集度”是前兩者得以實(shí)現(xiàn)的保證和巨大推力。

(三)計(jì)算機(jī)視覺技術(shù)對(duì)于現(xiàn)實(shí)本身的超越性

更值得注意的是通過計(jì)算機(jī)視覺技術(shù)手段,虛擬世界可以穿過不完美的現(xiàn)實(shí)世界,建構(gòu)一個(gè)比現(xiàn)實(shí)更美麗、更刺激、更富神奇的空間。這是一種技術(shù)浪漫主義??乱了固岢觥叭绻?jì)算機(jī)允許我們塑造,模仿和重現(xiàn)實(shí)在,那么計(jì)算機(jī)當(dāng)然也該允許我們改變知覺領(lǐng)域,挑戰(zhàn)并扭曲實(shí)在,并建造另外的實(shí)在,所以經(jīng)驗(yàn)主義并非挑戰(zhàn)浪漫主義,而是提供技術(shù)浪漫主義的敘事條件”。而這種對(duì)于現(xiàn)實(shí)的跨越與改變是可以在視覺虛擬與文本虛擬下實(shí)現(xiàn)的。于是人們可以在虛擬的游戲世界中感受到上天入地、吞云吐霧、時(shí)間穿梭、性別轉(zhuǎn)換等超越現(xiàn)實(shí)的虛擬實(shí)現(xiàn)。再次,在這種虛擬實(shí)在構(gòu)建的電腦游戲中,可以將虛擬的時(shí)間延長(zhǎng),減小人們“醒來”的機(jī)會(huì),使人長(zhǎng)時(shí)間地沉浸在這個(gè)虛擬的夢(mèng)境中。比如在棋類游戲中會(huì)因?yàn)橐痪值慕Y(jié)束而脫離棋局這個(gè)“弱虛擬”,但是在電腦游戲中可以通過“虛擬文本”的預(yù)先設(shè)計(jì)實(shí)現(xiàn)這個(gè)游戲的“無始無終”。而且在這種預(yù)設(shè)的“虛擬文本”中可以最大程度的降弱現(xiàn)實(shí)世界的殘酷與復(fù)雜,比如,在現(xiàn)實(shí)中對(duì)于“死亡”的巨大恐懼,可以通過虛擬文本改變成為 “靈魂出竅”并通過找回“尸體”這一種形式而得到重生,在這個(gè)虛擬世界里死亡只是可能會(huì)帶來一些虛擬的道具裝備和虛擬貨幣的丟失,這樣就大大降弱了現(xiàn)實(shí)世界的殘酷性和復(fù)雜性,建立一個(gè)更易于掌握的極樂世界。

參考文獻(xiàn):

[1]周憲,視覺文化的轉(zhuǎn)向[M],北京大學(xué)出版社,2008年1月第1版

[2]尼古拉斯?爾佐夫,視覺文化導(dǎo)論[M],江蘇人民出版社,2006年11月第1版

篇4

關(guān)鍵詞:OpenCV;手勢(shì)識(shí)別;模式識(shí)別;圖像處理

中圖分類號(hào):TP368 文獻(xiàn)標(biāo)識(shí)碼:B 文章編號(hào):2095-1302(2015)06-00-03

0 引 言

隨著科技的日益進(jìn)步,傳統(tǒng)的、基于鍵盤鼠標(biāo)的人機(jī)交互方式略顯單調(diào)。各國的研究者們探索著一個(gè)又一個(gè)新的人機(jī)交互方式,而在這些方式中,基于圖像理解的方式已經(jīng)取得了很大的進(jìn)展。我們的生活離不開肢體動(dòng)作,而圖像方式是計(jì)算機(jī)能夠理解人類動(dòng)作最直接的方式。圖像處理的研究?jī)?nèi)容非常廣泛,配合統(tǒng)計(jì)、模式識(shí)別等學(xué)科知識(shí)的應(yīng)用,我們已經(jīng)能夠識(shí)別并理解常用的人類肢體動(dòng)作。

在肢體動(dòng)作中,手勢(shì)動(dòng)作又是其中的重點(diǎn)。如今很多新的交互方式都建立在手勢(shì)識(shí)別理解的基礎(chǔ)上,例如:Microsoft的kinect系統(tǒng),primesense的生物識(shí)別系統(tǒng)等。很多公司已經(jīng)將其應(yīng)用到了醫(yī)療、教育教學(xué)、失語者手勢(shì)理解等領(lǐng)域。因此,研究手勢(shì)識(shí)別理解將會(huì)是未來計(jì)算機(jī)領(lǐng)域的一大熱點(diǎn)。

運(yùn)動(dòng)識(shí)別系統(tǒng)的進(jìn)步伴隨著數(shù)字圖像處理領(lǐng)域的進(jìn)步,各國學(xué)者相繼開發(fā)出了大量?jī)?yōu)秀的計(jì)算機(jī)視覺和圖像處理軟件包。大多數(shù)軟件包基于計(jì)算速度的考慮采用C/C++ 編寫[1]。雖然這些軟件包對(duì)計(jì)算機(jī)圖像處理和計(jì)算機(jī)視覺的研究提供了很大地便利,但也存在著不足之處[2]:

(1)現(xiàn)行的多數(shù)圖像處理平臺(tái)沒有提供高級(jí)數(shù)學(xué)函數(shù);

(2)Matlab 的運(yùn)行速度需要提高并且對(duì)宿主機(jī)器的配置要求較高;

(3)絕大多數(shù)圖像處理庫不支持嵌入式程序開發(fā)。

開源計(jì)算機(jī)視覺庫OpenCV(Open Source Computer Vision Library)的出現(xiàn)極大地彌補(bǔ)了這些不足,給開發(fā)者提供了強(qiáng)大的綜合開發(fā)平臺(tái)。

1 OpenCV簡(jiǎn)介

OpenCV(Open Source Computer Vision Library)誕生于Intel 研究中心,是一個(gè)開放源代碼的、高質(zhì)量的計(jì)算機(jī)視覺庫。它輕量且高效,采用C/C++ 語言編寫,可以運(yùn)行在Linux/Windows/Mac等操作系統(tǒng)上。OpenCV 還提供了Python、Ruby、Matlab及其他語言的接口[3]。OpenCV中包含了大量經(jīng)典的計(jì)算機(jī)視覺處理函數(shù),這些函數(shù)涵蓋了機(jī)器視覺領(lǐng)域的大多數(shù)應(yīng)用。OpenCV提供的視覺處理算法非常豐富,利用其開源特性,只要開發(fā)者處理得當(dāng),不需要添加新的外部支持也可以支持完整的編譯鏈接生成執(zhí)行程序。

OpenCV 現(xiàn)行版本為2.4.11.0,已放出了3.0.0的Beta版本?,F(xiàn)行版本的OpenCV分為18個(gè)模塊,其中常用的有8個(gè)模塊:

(1)Core:定義基本的數(shù)據(jù)結(jié)構(gòu),包括矩陣和被其他模塊使用的公共函數(shù);

(2)Imgproc:包含線性和非線性圖像過濾器、幾何圖形變化、色彩空間變化等功能;

(3)Video:包含運(yùn)動(dòng)分析、背景剪切和對(duì)象追蹤等功能;

(4)Calib3d:包含多視角集合算法、3D重建等功能;

(5)Features2d:包含特征匹配等功能;

(6)Objdetect:包含預(yù)定義對(duì)象距離探測(cè)等功能;

(7)Highui:包含一個(gè)簡(jiǎn)單易用的高層級(jí)接口,用以抽象不同操作系統(tǒng)對(duì)視頻提取和圖像操作的功能;

(8)GPU:包含GPU加速相關(guān)的算法,這些算法可以被其他模塊使用以加速程序的運(yùn)轉(zhuǎn)。

2 手勢(shì)識(shí)別簡(jiǎn)介

根據(jù)計(jì)算機(jī)系統(tǒng)檢測(cè)手勢(shì)姿態(tài)的傳感器的不同,我們可以將手勢(shì)識(shí)別理解系統(tǒng)分為兩類:一是利用數(shù)據(jù)手套獲相關(guān)技術(shù);二是利用計(jì)算機(jī)視覺捕獲和處理圖像流。利用數(shù)據(jù)手套捕獲技術(shù)實(shí)現(xiàn)的手勢(shì)識(shí)別系統(tǒng)使用不方便,用戶需要學(xué)習(xí)的內(nèi)容多且使用場(chǎng)景受到限制,而且成本較高[4]。而基于計(jì)算機(jī)視覺的手勢(shì)識(shí)別系統(tǒng)則具有使用場(chǎng)景廣闊、使用習(xí)慣符合人體本能、傳感器成本低、普及率高等優(yōu)勢(shì)。

基于圖像的手勢(shì)識(shí)別系統(tǒng)一般可分為手勢(shì)姿態(tài)圖像采集、手勢(shì)姿態(tài)圖像分割、手勢(shì)姿態(tài)特征提取及手勢(shì)姿態(tài)識(shí)別四個(gè)步驟[5]。

在大量手勢(shì)識(shí)別系統(tǒng)的實(shí)際開發(fā)過程中,都牽扯到使用膚色過濾系統(tǒng)來分割獲取手勢(shì)的binary圖像。手勢(shì)姿態(tài)的binary圖像的獲取關(guān)系到后期手勢(shì)姿態(tài)理解的穩(wěn)定性和準(zhǔn)確性,但是人體的手部顏色受到個(gè)體差異、光源顏色以及光照角度的影響,其中任何一個(gè)因素變化都將造成陰影、遮蔽等不良影響[6]。手勢(shì)識(shí)別的方法主要有4種,具體見表1。

表1 手勢(shì)識(shí)別方法靜態(tài)識(shí)別[7] 動(dòng)態(tài)識(shí)別[8]

模板匹配法(TM) 動(dòng)態(tài)時(shí)間規(guī)整法(DTW)

神經(jīng)網(wǎng)絡(luò)法(NN) 隱馬爾可夫模型法(HMM)

本文首先使用YCrCb膚色分割算法在使用者在線模式下提取使用者手勢(shì)姿態(tài)30組,利用30組手勢(shì)姿態(tài)的均值測(cè)量出使用者手部的色彩平均值;然后提取環(huán)境光照的平均值、極大值和極小值,利用環(huán)境關(guān)照的取值和手部均值做運(yùn)算,特定區(qū)域內(nèi)找點(diǎn)最少的環(huán)境光照值和手部均值,最后利用這兩個(gè)值進(jìn)行手勢(shì)姿態(tài)圖像binary處理。將得到的binary圖像進(jìn)行特征化處理,得到手部特征點(diǎn),通過對(duì)特征點(diǎn)的運(yùn)算,得到最終的手勢(shì)姿態(tài)理解。

3 手勢(shì)姿態(tài)的binary處理

手勢(shì)姿態(tài)的binary處理核心代碼如下:

主函數(shù):

frame = cvQueryFrame(capture);

//讀取一幀圖像

//cvShowImage( “Main_cam” , frame);

if( !frame ) break;

assert( 0 ==

binary_image_process( frame , mask , high_threshold1 , high_threshold2 , high_threshold3 , &is_get_binary )

);

cvShowImage( “Binary_cam” , mask );

//binary_image_process函數(shù),使用環(huán)境光和膚色在線測(cè)量均值得到的三個(gè)閾值:threshold1,threshold2,threshold3,分別對(duì)應(yīng)YCrCb顏色空間的Y,CR,CB通道:

IplImage* ycrcb = cvCreateImage( cvGetSize(frame) , 8 , 3 );

cvCvtColor( frame , ycrcb , CV_BGR2YCrCb );

for(int i=0 ; i < ycrcb->height ; i++ ) //二值化

{

uchar *row = (uchar *)(ycrcb->imageData) + i * ycrcb->widthStep;

for(int j=0 ; j < ycrcb->width ; j++ )

{

uchar *p = row + 3*j ;

//if( *(p+1) > threshold2 && *(p+2) < threshold3 )//||

if( *(p) < threshold1 )

{

binary_image->imageData[ i * (binary_image->widthStep) + j ] = 255; // 白色

}

else

{

binary_image->imageData[ i * (binary_image->widthStep) + j ] = 0; // 黑色

}

}

}

IplConvKernel *element = cvCreateStructuringElementEx( 4 , 4 , 0 , 0 , CV_SHAPE_RECT );//創(chuàng)建用于腐蝕的核函數(shù)

cvErode( binary_image , binary_image , element , 1); // Erotion

cvDilate( binary_image , binary_image , NULL , 1); // Dilation

cvReleaseStructuringElement( &element );

cvReleaseImage( &ycrcb );

經(jīng)過提取的手勢(shì)識(shí)別binary圖形如圖1(a)~(e)所示。

可見此方法提取的binary圖像清晰準(zhǔn)確,具有利用價(jià)值,可以為后期的特征提取與識(shí)別創(chuàng)造有利條件。

(a) (b)

(c) (d)

(e)

圖1 手勢(shì)識(shí)別binary圖形

4 手勢(shì)姿態(tài)特征的識(shí)別與理解

首先,我們通過對(duì)最小包絡(luò)圓和手腕的計(jì)算得出手掌心的位置,然后利用每個(gè)點(diǎn)與相鄰點(diǎn)做向量外積計(jì)算是否為手指尖點(diǎn)和手縫點(diǎn),最后即可得出手勢(shì)姿態(tài)的全部特征點(diǎn)。

//計(jì)算整個(gè)輪廓的中心點(diǎn)

for( int i=0 ; i < real_contours_number ; i++ ){

contour_rectangle = cvMinAreaRect2( sort_contours[i] , 0 );

arm_center[i].x = cvRound( contour_rectangle.center.x );

arm_center[i].y = cvRound( contour_rectangle.center.y );

cvCircle( frame , arm_center[i] , 10 , CV_RGB(255,255,255) , -1 , 8 , 0 );

}

//取得凸包,畫出指縫

for( int i=0 ; i < real_contours_number ; i++ ){ get_convex_hull( i );

finger_tip( i );

hand( i );

cvClearSeq( hull ); //清空凸包序列

cvClearSeq( defect );

}

最終,得到的含有全部手勢(shì)特征點(diǎn)的圖像如圖2(a) 、圖2(b)所示。

(a) (b)

圖2 含有全部手勢(shì)特征點(diǎn)的圖像

5 結(jié) 語

新版本的OpenCV計(jì)算機(jī)視覺庫給我們提供了很強(qiáng)大的計(jì)算機(jī)視覺處理能力,利用其提供的高級(jí)別函數(shù)和矩陣運(yùn)算能力,開發(fā)者們可以開發(fā)出大量基于圖像的應(yīng)用。利用OpenCV強(qiáng)大的可移植能力,開發(fā)者可以使用相應(yīng)的移植工具將PC平臺(tái)上的成果轉(zhuǎn)化到移動(dòng)端,這將會(huì)為開發(fā)者創(chuàng)造新的機(jī)會(huì)。

參考文獻(xiàn)

[1]喻擎蒼, 翁秀娟, 趙勻,等.交互式開放結(jié)構(gòu)計(jì)算機(jī)視覺平臺(tái)[J]. 計(jì)算機(jī)工程與應(yīng)用,2006,42(23):78-81.

[2]秦小文, 溫志芳, 喬維維. 基于OpenCV的圖像處理[J]. 電子測(cè)試, 2011(7):39-41.

[3]于仕琪, 劉瑞禎. 學(xué)習(xí)OpenCV( 中文版)[M]. 北京:清華大學(xué)出版社,2009.

[4] LEE C, XU Y. Online interactive learning of gestures for human /robot interfaces [C] Proceedings of the 1996 IEEE International Conference on Robotics and Automation. Washington,DC: IEEE Computer Society Press,1996,4: 2982-2987.

[5]趙健, 張冬泉. 基于OpenCV的數(shù)字手勢(shì)識(shí)別算法[J]. 計(jì)算機(jī)應(yīng)用, 2013, 33(z2):193-196.

[6] SURAL S,QIAN G,PRAMANIK S.Segmentation and histogram generation using the HSV color space for image retrieval[C] of the 2002 International Conference on Image Processing.Piscataway: IEEE,2002: 589 - 592.

篇5

多媒體技術(shù)是計(jì)算機(jī)技術(shù)和社會(huì)發(fā)展進(jìn)程中人類總需求的結(jié)合。計(jì)算機(jī)技術(shù)發(fā)展的初期解決的是數(shù)值計(jì)算問題,誕生的緣由是美國為了研究軍事技術(shù),對(duì)攻擊精度的計(jì)算。計(jì)算機(jī)硬件設(shè)備的發(fā)展,使計(jì)算機(jī)處理數(shù)據(jù)的能力越來越強(qiáng),逐漸從處理數(shù)值發(fā)展到對(duì)復(fù)雜的多種形式媒體的處理。多媒體技術(shù)融合了對(duì)數(shù)據(jù)、多種媒體、復(fù)雜的智能化處理和交互,并在高速信息網(wǎng)的作用下實(shí)現(xiàn)了信息資源的共享。目前,計(jì)算機(jī)多媒體技術(shù)已經(jīng)改變了人類的生活方式,促進(jìn)了現(xiàn)代文明的進(jìn)程,廣泛應(yīng)用于軍事、工業(yè)、通信、教育、金融、娛樂等諸多領(lǐng)域。

2多媒體技術(shù)的特征

從計(jì)算機(jī)處理多媒體的種類和處理的效果、人類接受的方式來分析,計(jì)算機(jī)多媒體技術(shù)主要具有多樣性、集成性、數(shù)字化、實(shí)時(shí)的交互性等特征。

2.1多樣性

計(jì)算機(jī)多媒體技術(shù)面向的媒體種類眾多(章惠,多媒體技術(shù)和教學(xué)的有機(jī)結(jié)合:洛陽大學(xué)學(xué)報(bào),2003),從最初的數(shù)值處理發(fā)展到了人類感官能觸及到的文字、圖像、聲音、動(dòng)畫、視頻等多種形式媒體的處理。媒體的多樣性,使媒體形式變得豐富多樣,這必將使表達(dá)更為自然生動(dòng),表現(xiàn)更為靈活,解決問題更為便捷。

2.2集成性

為了獲得更好的展示效果,各種媒體并不是各行其是的。計(jì)算機(jī)使用不同的媒體,共同展示相同的內(nèi)容,媒體與媒體之間的融合集成、充分展示,讓人們的不同感官得到充分刺激,使人們更易于接受(孫濤,計(jì)算機(jī)多媒體技術(shù)的應(yīng)用:長(zhǎng)春理工大學(xué)學(xué)報(bào),2011)。為了多媒體后期的運(yùn)用,各種媒體會(huì)被進(jìn)行數(shù)字化處理,然后由多通道統(tǒng)一采集、編輯、存儲(chǔ)、檢索、顯示、傳輸與合成。計(jì)算機(jī)領(lǐng)域內(nèi)最新的硬件和軟件技術(shù)也將促使多種媒體更好的處理效果和更快的處理速度。

2.3數(shù)字化

多媒體中的各種媒體,進(jìn)入計(jì)算機(jī)后,已全部轉(zhuǎn)化為了數(shù)字,以數(shù)字的形式展示和存儲(chǔ)。圖像經(jīng)采樣量化后,以BMP、RGB、CMYK、黑白灰度圖等數(shù)字化形式顯示、存儲(chǔ);聲音是通過一定的采樣頻率和采樣周期,實(shí)現(xiàn)模擬到數(shù)字的過程;而視頻是在每幀圖像和聲音的采樣、數(shù)字化基礎(chǔ)上,形成的連續(xù)信息。

2.4實(shí)時(shí)的交互性

傳統(tǒng)媒體是指報(bào)紙、廣播、電視、雜志,這些媒體只能單向、被動(dòng)地傳播信息,不能稱其為多媒體。多媒體技術(shù)與傳統(tǒng)媒體最大的區(qū)別就是實(shí)現(xiàn)了人機(jī)交互,使用戶能對(duì)多媒體信息進(jìn)行主動(dòng)選擇、操縱和控制,使得獲取和使用信息變被動(dòng)為主動(dòng),同時(shí)被人的多種感官所感受、體驗(yàn)。不僅如此,因?yàn)槎嗝襟w的實(shí)時(shí)性,即是視頻、聲音等媒體是沒有延遲的,隨著時(shí)間的變化而變化。所以,多媒體的交互在高速網(wǎng)絡(luò)的幫助下,能做到?jīng)]有延遲的做出實(shí)時(shí)反饋。

3計(jì)算機(jī)創(chuàng)新技術(shù)在多媒體技術(shù)上的應(yīng)用

多媒體技術(shù)涉及范圍非常廣泛,包括了計(jì)算機(jī)軟硬件技術(shù)、數(shù)字信息處理技術(shù)、數(shù)據(jù)壓縮、高性能大容量存儲(chǔ)、網(wǎng)絡(luò)通信技術(shù)等等。這些日新月異發(fā)展的新手段、新技術(shù),推動(dòng)多媒體系統(tǒng)逐步進(jìn)入人類社會(huì)許多領(lǐng)域。多媒體新的技術(shù)不時(shí)涌現(xiàn),帶給人們新的驚喜。人工智能是一門新的科學(xué)技術(shù),甚至有些大學(xué)將人工智能從計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)剝離出來,獨(dú)立成一個(gè)專業(yè),在學(xué)生本科期間就進(jìn)行相關(guān)研究。但事實(shí)上,人工智能是建立在數(shù)學(xué)和計(jì)算機(jī)科學(xué)與技術(shù)基礎(chǔ)上的高層次學(xué)科,是一門近幾年出現(xiàn)的最引領(lǐng)人類研究興趣的技術(shù)。人工智能研究的最終結(jié)果就是機(jī)器人,而事實(shí)上,機(jī)器人集多種媒體表現(xiàn)于一生,通過機(jī)器人的觸感模仿人類去理解和辨別外界。人工智能研究的圖像識(shí)別、自然語言處理、語言識(shí)別融合在了機(jī)器人身上,與多媒體技術(shù)廣泛結(jié)合,應(yīng)用于人類生活。我們從機(jī)器人身上看到了人工智能對(duì)多媒體技術(shù)的影響。下面從涉及到的幾個(gè)方面去分別探討。

3.1計(jì)算機(jī)視覺

人們通過感官獲取外界信息,僅視覺就能獲得外界80%-90%的信息(王守佳,基于圖像的人體檢測(cè)跟蹤和人臉識(shí)別的研究:吉林大學(xué),2013)。計(jì)算機(jī)視覺是一門屬于計(jì)算機(jī)智能的學(xué)科,采用了動(dòng)物視覺原理,具有獲取圖像、分析圖像到理解圖像的工作過程。計(jì)算機(jī)視覺通過鏡頭等圖像傳感設(shè)備代替人類的眼睛來獲取周圍環(huán)境的圖像,依靠計(jì)算機(jī)來代替人類大腦的工作,將采集到的圖像進(jìn)行分析和處理。人類處于一個(gè)三維的環(huán)境之中,計(jì)算機(jī)視覺技術(shù)可以幫助分析處理。處理的手段可分為三個(gè)層次,底層、中間層、高層。底層就是圖像處理技術(shù),將二維圖像去噪、邊緣檢測(cè)后進(jìn)行分割、根據(jù)圖像特征進(jìn)行提取、圖像識(shí)別等。中間層是指對(duì)圖像、視頻外在特征的歸納判斷,譬如形狀、顏色、運(yùn)動(dòng)軌跡等。高層,即是對(duì)外界事物和環(huán)境的觀察和理解。由以上三個(gè)層次可見,利用計(jì)算機(jī)視覺技術(shù)能對(duì)數(shù)字化圖像改變形態(tài)、尺寸、色彩調(diào)整、文件格式轉(zhuǎn)換等。目前,計(jì)算機(jī)視覺技術(shù)還能對(duì)圖像進(jìn)行高效的檢測(cè)、高速的識(shí)別,對(duì)運(yùn)動(dòng)軌跡進(jìn)行精準(zhǔn)判斷。而這些已被廣泛地應(yīng)用于多媒體產(chǎn)品中。

3.2音頻技術(shù)

聲音是多媒體技術(shù)經(jīng)常采用的一種媒體形式,包括了語音和音樂等。多媒體通常需要通過聲音去烘托主題氣氛,彰顯意境。特別是自學(xué)型多媒體系統(tǒng)和多媒體廣告,沒有人進(jìn)行現(xiàn)場(chǎng)講解,那么就需要加入聲音進(jìn)行解說,這樣,數(shù)字音頻信號(hào)顯得更加重要。音頻技術(shù)基于電聲技術(shù),主要包括:去噪、壓縮、調(diào)整振幅等的數(shù)字化處理,以及語音處理和識(shí)別。長(zhǎng)久以來,語音識(shí)別是人們的夢(mèng)想,人們一直期盼計(jì)算機(jī)能夠聽懂人說話,根據(jù)人的語言做出相應(yīng)動(dòng)作,這也是設(shè)計(jì)智能計(jì)算機(jī)的目的之一。如今,具備多種語言識(shí)別功能已成為多媒體設(shè)備的標(biāo)配,識(shí)變率也非常高。無論持哪種語言、地方口音的人們,都能通過語音轉(zhuǎn)化為文字,甚至通過語音傳送指令,得到回應(yīng)、達(dá)到意圖。

3.3虛擬現(xiàn)實(shí)技術(shù)

虛擬現(xiàn)實(shí)技術(shù)是利用計(jì)算機(jī)多媒體技術(shù),運(yùn)用3D場(chǎng)景、燈光、聲音、動(dòng)感創(chuàng)造模擬出真實(shí)氛圍,為用戶建立出一個(gè)虛擬環(huán)境。虛擬現(xiàn)實(shí)技術(shù)與計(jì)算機(jī)仿真技術(shù)相結(jié)合,將用戶置身其中進(jìn)行學(xué)習(xí)、工作與娛樂。這種技術(shù)已被廣泛應(yīng)用于教育教學(xué)、科普、軍事、醫(yī)療、娛樂以及大型的網(wǎng)絡(luò)游戲中。虛擬技術(shù)投入成本較高,成熟的設(shè)施主要運(yùn)用于教學(xué),比如多媒體航空飛行教學(xué)系統(tǒng),通過該系統(tǒng),可按100%比例局部展示表盤、操縱桿、艙外景物,通過配合空中場(chǎng)景、感知各種場(chǎng)景給身體帶來的變化。使用這套系統(tǒng)進(jìn)行模擬訓(xùn)練,可以有效的提高飛行員對(duì)飛機(jī)的操作水平。隨著計(jì)算機(jī)技術(shù)的迅猛發(fā)展,虛擬現(xiàn)實(shí)技術(shù)成為目前的高新技術(shù)。在多媒體環(huán)境中,多種媒體的相互融合,使媒體的形式更加多樣,多媒體技術(shù)在模式識(shí)別、語音識(shí)別和傳感技術(shù)基礎(chǔ)上,提取對(duì)象面部特征,模擬觸覺、視覺、聽覺等感官,使人處于逼真的三維世界,當(dāng)人有反應(yīng)或行動(dòng)時(shí),場(chǎng)景還會(huì)適時(shí)變化,即是讓人如臨其境的、自然的與計(jì)算機(jī)進(jìn)行交互。虛擬現(xiàn)實(shí)技術(shù)具有非常廣闊的發(fā)展前景,為人們的日常生活提供了很多樂趣和便捷。

3.4網(wǎng)絡(luò)化

多媒體應(yīng)用的數(shù)據(jù)通道是通信網(wǎng)絡(luò),網(wǎng)絡(luò)給了多媒體更大的施展空間。多媒體技術(shù)的應(yīng)用要想在網(wǎng)絡(luò)上有所建樹,必要受通信技術(shù)的影響。在網(wǎng)絡(luò)通信技術(shù)的進(jìn)步和整合下,網(wǎng)絡(luò)帶寬影響傳輸速率、通信協(xié)議影響傳輸可靠性、交換方式影響信道利用率,這些勢(shì)必會(huì)影響多媒體的傳輸。計(jì)算機(jī)網(wǎng)絡(luò)給用戶提供了一個(gè)難以想象的龐大的信息網(wǎng)絡(luò)平臺(tái),豐富的信息資源隨手拈來,方便于人們的學(xué)習(xí)、工作和生活交流。而無線網(wǎng)絡(luò)技術(shù)的發(fā)展,使資源變得隨手可?。ɡ顣造o,計(jì)算機(jī)多媒體技術(shù)的應(yīng)用現(xiàn)狀與發(fā)展前景:科技情報(bào)開發(fā)與經(jīng)濟(jì),2007),人們可隨時(shí)隨地通過訪問全球網(wǎng)絡(luò)和設(shè)備,便捷地實(shí)現(xiàn)對(duì)多媒體資源的共享,是未來發(fā)展的主題。計(jì)算機(jī)技術(shù)的不斷創(chuàng)新和發(fā)展,促使了巨大的變革。CPU、內(nèi)存、GPU等在內(nèi)的計(jì)算機(jī)終端硬件設(shè)備性能越來越先進(jìn);而網(wǎng)絡(luò)設(shè)備,例如服務(wù)器、路由器、網(wǎng)橋、交換機(jī)等也越來越強(qiáng)大。計(jì)算機(jī)計(jì)算的精度、速度、邏輯判斷能力和充裕的帶寬,讓人們更加游刃有余的與網(wǎng)絡(luò)虛擬世界互動(dòng)。網(wǎng)絡(luò)環(huán)境的高質(zhì)、高速,消除了人與人空間和時(shí)間上的困擾,能全方位的為人類效勞。動(dòng)態(tài)和交互式多媒體技術(shù)還能在網(wǎng)絡(luò)環(huán)境中創(chuàng)建更形象的2D和3D場(chǎng)景。辦公、教學(xué)和娛樂工具在視頻、音頻設(shè)備的協(xié)助下,集成在終端多媒體計(jì)算機(jī)中,新一代用戶界面與人工智能等個(gè)性化、網(wǎng)絡(luò)化的多媒體軟件應(yīng)用,可隨時(shí)與身處世界任何角落的人們進(jìn)行交流。

4結(jié)論

篇6

1引言

利用攝影測(cè)量和遙感為制圖和GIS獲取數(shù)據(jù),傳統(tǒng)方法的特點(diǎn)是人工有效地從影像__匕提取高精度的三維數(shù)據(jù),在距離_匕這些影像從空間平臺(tái)獲取的圖像到近景固定目標(biāo)圖像。一般來說,這些生產(chǎn)程序是費(fèi)時(shí)并且很昂貴。在目前的制圖和GIS預(yù)算基礎(chǔ)上,傳統(tǒng)的方法限制了能提取的地形信息的數(shù)量和分辨率。另外,山于數(shù)據(jù)獲取當(dāng)局采用了不合理的數(shù)據(jù)更新周期,在很多情況下,數(shù)據(jù)趨向于過時(shí)。數(shù)據(jù)獲取系統(tǒng)總是技術(shù)驅(qū)動(dòng)的,并且適應(yīng)最新的方法和設(shè)備。將來,當(dāng)數(shù)字系統(tǒng)成為現(xiàn)實(shí)時(shí),這將毫無疑問會(huì)繼續(xù).在提高自動(dòng)化水平的基礎(chǔ)上,數(shù)字系統(tǒng)為提取制圖和GIS所需信息提供新方法。新方法中也包括計(jì)算機(jī)視覺中的邊緣裁剪技術(shù),該技術(shù)利用了人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域知識(shí)。兇此,攝影測(cè)量與遙感和計(jì)算機(jī)視覺與人工智能等領(lǐng)域的研究人員觸合他們各自的技能來解決這個(gè)應(yīng)用領(lǐng)域的一些具體的問題。在攝影測(cè)量與遙感領(lǐng)域自動(dòng)提取地面地形信息需要過程的簡(jiǎn)潔表達(dá)和壓縮影像范圍的知識(shí)。這是一個(gè)很重要的工作,因?yàn)橛跋裰袃?chǔ)存著極其復(fù)雜的信息。攝影測(cè)量中獲得的地表地形的影像的比例尺可從l:3000到l:90000,而遙感獲得的影像的像素分辨率可從!米到30米不等。地形的影像特征的結(jié)構(gòu)很復(fù)雜.它是由很多不同的亮度組合而成的,這些亮度可以表達(dá)例如,核物、地表、水文等這樣的自然特征:也可以表達(dá)例如,房屋、道路等人工建筑,還能表達(dá)像陰影或亮度所造成影明的人造物體。另外,遙感影像中,一些特征之間的關(guān)系比一般照片上的特征之間的關(guān)系復(fù)雜。這些特征意味著航天和衛(wèi)星影像的信息提取是很大的挑戰(zhàn)。信息提取的研究首先得考慮數(shù)據(jù)的語義方面的問題??墒?提取的信息的幾何性質(zhì)也必須被考慮,以至于可以確保空間數(shù)據(jù)的相關(guān)規(guī)范性。計(jì)算機(jī)視覺是一門自動(dòng)和集成廣泛可用于可視處理和表達(dá)方法的科學(xué),通過建立清晰、有意義的影像上的對(duì)象描述,應(yīng)用方法和技術(shù)很廣泛,其中包括數(shù)字影像處理,模式識(shí)別,幾何建模,理解和認(rèn)知處理.計(jì)算機(jī)視覺本身主要涉及影像解譯和圖像識(shí)別問題,并且試圖通過目標(biāo)和場(chǎng)景識(shí)別來解決這些問題。在這個(gè)過程中,使用從影像中提取屬性和關(guān)系的技術(shù)、形狀表達(dá)和描述技術(shù),最后,利用提取和描述的特征進(jìn)行基于模型的識(shí)別。由于影像獲取的方法,在從數(shù)字遙感影像提取信息的過程中計(jì)算機(jī)視覺方法的應(yīng)用是很復(fù)雜的,因而,當(dāng)使用針對(duì)普通照片影像的提取方法時(shí),要仔細(xì)考慮遙感影像的數(shù)據(jù)特征。在計(jì)算機(jī)視覺應(yīng)用中很難處理的特征,在航空和衛(wèi)星影像同樣也是很難處理。普通的影響因素包括獲取影像過程中的噪音,陰影的影響,由于照相機(jī)的角度和定位引起的幾何變形的影響和光照的影響,由于封閉和部分目標(biāo)等問題所引起的影響.解譯航空(衛(wèi)星)影像和其他的圖像時(shí)采用的方法是不同的.三維物體幾何形狀是航空影像判讀過程中的最基本的元素,這并不是因?yàn)橐崛「叱痰脑?而且是因?yàn)樵谂凶x中三維對(duì)象可提供更多的信息。是三維還是二維信息更有利于特征的描述,這樣的問題便被提出來了。在計(jì)算機(jī)科學(xué)領(lǐng)域里,對(duì)大多數(shù)研究而言,二維圖像數(shù)據(jù)一般認(rèn)為是足夠的,盡管有研究小組正從事立體視覺和深度信息提取方面的研究。盡管有些例外,但大多數(shù)形狀和位置描述決定了計(jì)算機(jī)視覺中的對(duì)象模型,對(duì)于中、低分辨率的航空影像,使用纂于形狀的識(shí)別是令人質(zhì)疑的。然而,上下文信息對(duì)遙感影像的解譯有很大的作用。比如,橋作為穿過河流的道路的一部分可能很容易被識(shí)別。航空影像中的目標(biāo)很密集,并有很多的組成部分,這一現(xiàn)象己被認(rèn)識(shí)到了。這與計(jì)算機(jī)視覺最近的發(fā)展趨勢(shì)是一致,計(jì)算機(jī)視覺識(shí)別圖像上的目標(biāo),首先是分離不同目標(biāo)的組成部分和它們之間的關(guān)系。這篇文章將回顧一些在計(jì)算機(jī)視覺中己使用的知識(shí)描述和建模的方法,并給出他們?cè)谘芯窟b感影像理解方面的例子。方法很多,要討論這個(gè)領(lǐng)域中所有正在被研究者所使用的方法是不可能的。其他方法的討論可能會(huì)涉及其他的領(lǐng)域,如Crevicr和LePage基于知識(shí)的影像理解的方法.Hancock和Kittler方法是兩種松弛技術(shù),sriniva犯n是人工智能技術(shù)在遙感方面的探索等。第二部分將介紹機(jī)器視覺領(lǐng)域中的知識(shí)的定義、知識(shí)表達(dá)的方法、控制問題、特征建模方法。第三部分介紹特征表達(dá)和特征識(shí)別的過程。第四部分介紹知識(shí)表達(dá)方法在航空測(cè)量和遙感中的應(yīng)用實(shí)例.

2知識(shí)、表達(dá)和模型

2.1知識(shí)的定義•MerriamWebsterDictionary把知識(shí)定義為己知的事實(shí)和條件,知識(shí)是通過經(jīng)驗(yàn)和聯(lián)想獲得,它的范圍包括人所獲得的信息和理解,是己知的總和。表達(dá)是描述的行為,狀態(tài)和行為的描述.表達(dá)成與本質(zhì)相應(yīng)的具有特殊特征或品質(zhì)的符號(hào)、副本或圖像。模型是事物的仿真表達(dá),是仿真的實(shí)例。在計(jì)算機(jī)視覺和人工智能中,這些術(shù)語的應(yīng)用不是很嚴(yán)格.與它們的字典中的意思和技術(shù)定義相適應(yīng),很難確切定義。計(jì)算機(jī)視覺必須獲取影像中場(chǎng)景的有用的描述,最初的描述就是圖像強(qiáng)度值的陣列。在低層視覺階段,進(jìn)行圖像的初步處理。中級(jí)階段應(yīng)用獨(dú)立的鄰域處理方法提取圖像的特征和標(biāo)識(shí)不同的部分。高級(jí)階段歸納更多圖像特征表達(dá),在這個(gè)階段進(jìn)行初步識(shí)別.為了處理光線和視角的變化、形狀和陰影的影響、圖像處理如,相機(jī)角度和位置的變化和低層處理中的嗓聲問題,我們需要現(xiàn)實(shí)世界有關(guān)圖像獲取和應(yīng)用等方面的知識(shí),這些知識(shí)是較高層的豐富的表達(dá),這在計(jì)算機(jī)視覺中稱為模型。這些模型解釋、描述或抽象了圖像信息。圖像和模型之間的橋梁就是一定范圍的表達(dá),它聯(lián)結(jié)著輸入圖像和輸出解釋。(l)生成圖像,圖像是輸入數(shù)據(jù)的圖像和模擬表達(dá)例如:二值圖像和側(cè)面影像。(2)分割圖像,分割后的圖像由與實(shí)際目標(biāo)相應(yīng)的一些像素組成,例如:分割算法的輸出。(3)關(guān)系模型,它是經(jīng)過編碼后的知識(shí),用于高層推理和解譯.每種表達(dá)方法有它的應(yīng)用范圍的局限性。所以,在圖像解譯中,所有四種類型的表達(dá)方法都是重要的。我們應(yīng)該重點(diǎn)放在第四種上,即關(guān)系模型,它包含了用于圖像理解目的的知識(shí)表達(dá)和模型。2.2知識(shí)表達(dá)知識(shí)表達(dá)的目的是用計(jì)算機(jī)易于處理的形式表達(dá)知識(shí)。一個(gè)好的計(jì)算機(jī)表達(dá)語言應(yīng)該易于表達(dá)、簡(jiǎn)潔、意義明了的、獨(dú)立的。FOL(FirstOrderLoglc)語言是人工智能中表達(dá)方案的基礎(chǔ).FOL有規(guī)范的語法和語義,在這種語言里,一個(gè)句子的解譯也就是上面談及的。FOL的推斷過程允許從舊語句中推斷出新語句。這種規(guī)范的推斷過程可以用于自動(dòng)的從已知的事實(shí)中獲取正確的結(jié)論.邏輯編程語言和產(chǎn)品系統(tǒng)二者都以FOL為基礎(chǔ).像Prolog這樣的邏輯編程語言允許用FOL的嚴(yán)格模式描述知識(shí),也能完成推斷過程,可以從通用的知識(shí)里提取新的信息。邏輯編程語言通常使用“后向鏈”控制,用后向的邏輯推理法:為證明一些事物,他們發(fā)現(xiàn)數(shù)據(jù)庫中的邏輯關(guān)系有助于結(jié)論的形成。因此,當(dāng)一個(gè)目標(biāo)確定后,“后向鏈”是推理中的最佳方式。產(chǎn)品系統(tǒng)由現(xiàn)存的事物的知識(shí)庫、一組規(guī)則或“產(chǎn)品”組成,這些都是用邏輯關(guān)系表達(dá)的。下面是一個(gè)產(chǎn)品系統(tǒng)的例子。如果一個(gè)區(qū)域是一個(gè)長(zhǎng)型的、性質(zhì)相同的目標(biāo),那么他屬于道路。產(chǎn)品系統(tǒng)以匹配,選擇,產(chǎn)生結(jié)果這種方式永不停息地循環(huán),應(yīng)用數(shù)據(jù)庫的知識(shí),產(chǎn)生新的信息。在匹配階段,系統(tǒng)尋找所有已有的、滿足當(dāng)前數(shù)據(jù)的法則。在選擇階段,系統(tǒng)運(yùn)用第一階段的匹配原則,選擇一個(gè)規(guī)則來執(zhí)行。選擇的規(guī)則在結(jié)果產(chǎn)生階段被執(zhí)行,在這個(gè)階段可能會(huì)牽涉知識(shí)庫里知識(shí)的增加或側(cè)除,和數(shù)據(jù)的輸入、輸出。在人工智能和航空側(cè)里與遙感領(lǐng)域,框架和語義網(wǎng)絡(luò)是最近最流行的值時(shí)表達(dá)結(jié)構(gòu)。它應(yīng)用隱喻,把對(duì)象表達(dá)為曲線圖中的節(jié)點(diǎn),這些節(jié)點(diǎn)用分類的結(jié)構(gòu)組織,節(jié)點(diǎn)之間的關(guān)系表述為二進(jìn)制的關(guān)系.在框架系統(tǒng)中,二進(jìn)制的關(guān)系被認(rèn)為是其他框架填充過來的空槽;在語義網(wǎng)絡(luò)中,它們之間的關(guān)系被認(rèn)作是節(jié)點(diǎn)中的有向線。這兩個(gè)系統(tǒng)的意義和所要完成的任務(wù)是相同的.描述邏輯系統(tǒng)是從語義網(wǎng)絡(luò)發(fā)展而來的,最基本的思想是利用目標(biāo)和類別的復(fù)雜定義和它們之間來進(jìn)行表達(dá)和推理。描述邏輯語言提供三種推理支持:(l)概念描述的分類,在特殊的層次中概念的自動(dòng)整理。(2)對(duì)獨(dú)立目標(biāo)根據(jù)它們的屬性分類。(3)知識(shí)庫所有知識(shí)一致性維護(hù)。對(duì)于這些邏輯所支持的語言幾乎無法表達(dá),并且很難詳細(xì)闡述復(fù)雜的制約條件.這些語言的優(yōu)點(diǎn)是他們有依據(jù)推理服務(wù)的正式的語義和簡(jiǎn)單的邏輯操作.簡(jiǎn)言之,像Prolog這樣的邏輯編程語言有一個(gè)執(zhí)行模型,這種執(zhí)行模型很簡(jiǎn)單,以至于一個(gè)程序設(shè)計(jì)員就可處理。近來,Pr。109編譯器被推薦作為小型人工智能項(xiàng)目一c產(chǎn)品系統(tǒng)的首選開發(fā)工具,該產(chǎn)品系統(tǒng)是一個(gè)流行的人工建模推理系統(tǒng);與Prolog不同的是,產(chǎn)品系統(tǒng)不是基于查詢的,而是開放的、不間斷的系統(tǒng),它處于連續(xù)的操作中。語義系統(tǒng)提供一個(gè)比基于文本式的形式主義更容易理解的圖形界面。它可以像FOL一樣富有表現(xiàn)力,盡管大多數(shù)并不是這樣,因?yàn)檫@種系統(tǒng)強(qiáng)加嚴(yán)厲的拘束于可以表達(dá)的對(duì)象之上.他的優(yōu)點(diǎn)其中包括能表模塊方法中的層次關(guān)系,并且相對(duì)比較簡(jiǎn)單。描述邏輯把清楚的語義與簡(jiǎn)單的邏輯操結(jié)合起來.所以,當(dāng)所有的方案都依據(jù)FOL語言,就有這種或那種方法的折衷.2.3控制問題不管選擇什么樣的影像表達(dá),影像數(shù)據(jù)的處理和影像數(shù)據(jù)的表達(dá)處理可以稱為影像數(shù)據(jù)驅(qū)動(dòng),稱為從下而上的控制,或可稱為內(nèi)部模型控制,叫做從上而下的控制。自下而上的數(shù)據(jù)驅(qū)動(dòng)包括從影像處理、分割到描述,每一階段為下階段準(zhǔn)備數(shù)據(jù)。如果鄰域影像處理方法成本底,而且輸入的數(shù)據(jù)是準(zhǔn)確、可信的話,從下而上的控制是有用的.馬爾(Marr)和Ullman致力于自下而上的方法研究.這種自下而上的方法是基于人類視覺數(shù)據(jù)不變的自下而上的處理基礎(chǔ)上的。Marr認(rèn)為這個(gè)系統(tǒng)導(dǎo)致一個(gè)中間描述叫做21/2維的結(jié)構(gòu),包括地表定位、參考視場(chǎng)中的距離和方位。另外,Ullman假設(shè)高水平的處理叫做可視化程序,它檢測(cè)中間表達(dá)中的感興趣特征。自上而下的模型驅(qū)動(dòng)控制是被知識(shí)庫里產(chǎn)生的可能性和先決條件驅(qū)動(dòng)的。因而,模型驅(qū)動(dòng)控制嘗試用一種目標(biāo)指向的行為去執(zhí)行內(nèi)部的模型證明.一個(gè)普通的自上而下的控制方法是假設(shè)和證明。這個(gè)一般可以控制低層次的操作.好像支持的人類可視化某些方面的關(guān)系并不是自上而下,這個(gè)發(fā)現(xiàn)促進(jìn)了模型驅(qū)動(dòng)方法的發(fā)展。降低低水平處理過程的設(shè)想亦如此。在實(shí)際操作中,計(jì)算機(jī)視覺系統(tǒng)趨向于混合使用自上而下和自下而上兩中控制方法,系統(tǒng)的重點(diǎn)在方法效率和實(shí)用上.并行和串行計(jì)算可能在所有的設(shè)計(jì)中都用上了。自上而下和自下而上這兩種控制隱含了一種層次處理關(guān)系.在層次控制中,控制程序看作是合作收集和競(jìng)爭(zhēng)專家,在任何時(shí)候,“專家”幫助大多數(shù)選擇。黑板結(jié)構(gòu)是這種方法的一個(gè)例子,在黑板結(jié)構(gòu)中模塊化的知識(shí)源之間通過一個(gè)公共的黑板(存儲(chǔ)器)進(jìn)行通訊,它們可以通過這個(gè)公共的黑板進(jìn)行輸入和輸出。2.4建模問題在計(jì)算機(jī)視覺中的基于模型的方法中,在一類圖象中可按優(yōu)先次序定義了一些模型,并利用這些模型來進(jìn)行目標(biāo)識(shí)別。這些模型對(duì)現(xiàn)實(shí)世界和應(yīng)用中的一些外部知識(shí)進(jìn)行編碼二目標(biāo)模型可能是外觀模型,形狀模型,物理模型等。在目標(biāo)表達(dá)上,每一個(gè)模型應(yīng)該適應(yīng)一定的變化范圍,這些變化可能是由于視角的變化、光照的變化、柔韌目標(biāo)的形狀變化等因素引起的.另外,影像獲取本身的多變性、每組對(duì)象中單個(gè)對(duì)象的多變性,也要考慮進(jìn)去.感興趣的目標(biāo)可能是二維的或三維的:這些目標(biāo)可能是剛性的、有鏈接的或有韌性的。圖像可能是距離圖像或是強(qiáng)度圖像.識(shí)別就是確定圖像上不同的特征和在匹配階段對(duì)比模型特征。模型(圖像)的關(guān)聯(lián)特征可以用前面己經(jīng)討論過的方法中的一種來表達(dá)。在一幅沒有限制場(chǎng)景的強(qiáng)度圖像識(shí)別一個(gè)三維目標(biāo)是很困難的,航片和衛(wèi)星影像就屬于這類情況。深度信息的丟失、遮擋和混亂的細(xì)節(jié)信息產(chǎn)生了很多問題:另外,圖像的強(qiáng)度間接與目標(biāo)的形狀相關(guān).

3特征的自動(dòng)提取

絕大多數(shù)影像解譯系統(tǒng)的目的是在影像中提取/識(shí)別目標(biāo).在基于模型的方法中,它通過首先提取目標(biāo)屬性,然后再將他們與模型匹配。3.1特征屬性的描述在計(jì)算機(jī)可視中,目標(biāo)的屬性、性質(zhì)和可以從影像中提取的場(chǎng)景都叫做特征.這些屬性有時(shí)被分類為全局屬性和局部屬性。然而,在攝影測(cè)量與遙感領(lǐng)域,“特征”這個(gè)術(shù)語是指圖像上可識(shí)別的目標(biāo)或者結(jié)構(gòu),如道路、建筑物,特征的分類依賴于具體應(yīng)用:舉個(gè)例子,對(duì)航空影像來說,全局性的描述可以包括航影像覆蓋的地區(qū)例如:城區(qū)或郊區(qū)。避免過多的名字和定義,文章中的混淆就會(huì)減少。在這篇文章里,攝影測(cè)量中的術(shù)語“特征”即是影像中可識(shí)別的對(duì)象。若涉及對(duì)象的性質(zhì),我們就要用術(shù)語:“屬性”了。目標(biāo)的全局屬性可以概括為目標(biāo)完全可視化部分的信息,如面積、周長(zhǎng)、長(zhǎng)度等。理論上講,為了處理多分辨率和多變的圖像,這些全局性屬性應(yīng)是縮放和平移不變的。特征不應(yīng)該重疊,這樣可以避免混亂和遮擋:另外,目標(biāo)每個(gè)不同視角需要獨(dú)立的模型,這樣可以處理多視角圖像。例如,在攝影測(cè)量中,局部屬性可能是聯(lián)結(jié)和分割的邊緣,這些可以看作特征的獨(dú)立屬性。然而,在計(jì)算機(jī)可視化中,局部屬性大多數(shù)時(shí)候被看作屬性之間的聯(lián)系,或者是上下文。相關(guān)的屬性在圖表中構(gòu)成。評(píng)價(jià)特征屬性表達(dá)方案的標(biāo)準(zhǔn)是敏感度、范圍、穩(wěn)定性、有效性和獨(dú)特性.根據(jù)這些標(biāo)準(zhǔn),研究者總結(jié)出一個(gè)基于模型方法的好的表達(dá),.其中包括局部屬性和圖像特定區(qū)域和目標(biāo)的組合。這是因?yàn)榫植繉傩钥梢愿鶕?jù)輸入數(shù)據(jù)的有限部分有效計(jì)算出來;這些屬性很穩(wěn)定,因?yàn)楸硐蟮囊稽c(diǎn)變化僅僅影響某些屬性,目標(biāo)的局部遮擋僅僅影響局部特征。邊緣連接就是邊緣分析基礎(chǔ)上的局部特征的一個(gè)例子.多尺度表達(dá)是可取的,因?yàn)樵诖蟪叨壬?兩個(gè)大體上相似的目標(biāo)具有相似的描述,即使在小尺度上有一些不同。不管是從影像數(shù)據(jù)庫還是從經(jīng)過高分辨率重采樣的影像上,對(duì)于航空影像和衛(wèi)星影像而言,這種多尺度描述是比較容易獲得的。這個(gè)選擇項(xiàng)并不是對(duì)大多數(shù)計(jì)算機(jī)視覺應(yīng)用都有用。唯一的模型判斷標(biāo)準(zhǔn)在特征識(shí)別過程中并不重要,因?yàn)樽R(shí)別的方法能夠允許由于噪音和遮擋等原因造成的錯(cuò)誤匹配。比較航空影像、衛(wèi)星影像和計(jì)算機(jī)視覺中的圖像而言,前者局部特征的定位比較容易,因?yàn)榍罢叩耐夥轿辉睾拖鄼C(jī)參數(shù)是己知的或者可以推倒出來。對(duì)于大多數(shù)航空影像計(jì)算機(jī)視覺研究而言二描述己經(jīng)是足夠的,但是三維模型和匹配經(jīng)常應(yīng)用于攝影測(cè)量中,例如建筑物形狀提取。最后,什么屬性對(duì)于特征提取或識(shí)別有用呢?屬性要能表達(dá)不同的特征和圖像不同的部分之間的區(qū)別。第二,屬性要能反映外部世界的規(guī)律和結(jié)構(gòu)。這樣,屬性的選擇就是與應(yīng)用無關(guān)的了.在遙感中,通過輻射校正、地物的光譜特征和地面的真實(shí)情況,所得到的多光譜影像的特征是眾所周知的。一些屬性的規(guī)律將可以從這些特征知識(shí)中提取:例如,不同類型的地面覆蓋的光譜特性,如不同類型的植被、土壤、礦物質(zhì)、水和一些人工建筑物經(jīng)過多年廣泛的實(shí)驗(yàn)和地面事實(shí)已經(jīng)被確定了。在計(jì)算機(jī)視覺中,另外一些屬性是基于形狀和外形的;例如.道路是窄的條帶,建筑物是封閉的多邊型等。另外一些屬性是基于上下文的,例如,建筑物通常位于道路旁,橋一般是跨越在河上的。特征可以一定的結(jié)構(gòu)進(jìn)行組織。一種方法是用層次的方法組織它們的部分或全部關(guān)系,例如基于系統(tǒng)的語義網(wǎng)絡(luò)。第二種方法根據(jù)鄰接關(guān)系來組織它們。后者對(duì)應(yīng)于空間臨近或上下文關(guān)系。二者都可以用圖形表達(dá)。32特征識(shí)別計(jì)算機(jī)視覺中的目標(biāo)識(shí)別與攝影測(cè)量中的特征提取相對(duì)應(yīng)。為了從一幅圖像上識(shí)別單個(gè)目標(biāo),自下至上的數(shù)據(jù)驅(qū)動(dòng)控制通常是足夠的,其中屬性第一次被檢測(cè)和表達(dá)成符號(hào).通過聚集比較原始的屬性來確定新的特征.利用這些屬性從模型庫中選擇合適的模型,也稱為索引。然后找到與影像屬性最匹配的模型屬性。最后,利用一些決策程序來校正模型屬性.查找過程本質(zhì)上包括歸類、建立索引和匹配等步驟。然而,在包含多個(gè)目標(biāo),并且有遮擋和重疊的比較復(fù)雜的遙感影像中自下至上控制是不適用的,另外,在質(zhì)量比較差的圖像中噪聲會(huì)產(chǎn)生假屬性。對(duì)于遙感圖像,這是一個(gè)非常合適的方案.在這種情況下,自上而下或者混和控制策略是比較有用的.在自上而下的方法中,假設(shè)階段需要利用屬性檢索模型的組織,使得基于觀測(cè)的屬性和一小部分合適的目標(biāo)可以被選擇.在校正階段應(yīng)用選用的模型來識(shí)別目標(biāo).在混合方法上,兩個(gè)階段的聯(lián)合提高了處理效率。當(dāng)結(jié)果屬性比單個(gè)屬性更豐富時(shí),就可以對(duì)屬性進(jìn)行組合.這個(gè)過程稱為知覺組織.Lowe提出了目標(biāo)識(shí)別中組合問題和屬性組合標(biāo)準(zhǔn)。他尋找邊緣分割的結(jié)構(gòu),它應(yīng)該是在一定的投影方式下具有普遍性。例如同線性和平行邊緣。Zerroug和Nevatia應(yīng)用均勻投影方法把圓柱投影到二維空間。許多研究者己經(jīng)研制了專業(yè)組合方法,例如:steger等的用于路道提取的方案,Hewricsson和Baltsavias等的用于建筑物的提取方案。顯然局部上下文信息在屬性組合中發(fā)揮著重要的作用,因?yàn)?為了定義局部上下文信息,人們希望把描述局部屬性與其他屬性之間的關(guān)系作一些特定安排。有關(guān)遮擋、透視、幾何、物理方面的一般知識(shí)對(duì)識(shí)別來說是必要的.Brooks(1981)建立了一個(gè)名為^eRoNYM的目標(biāo)識(shí)別幾何推理系統(tǒng).Matsuyama和H、ang(一985)研制的s一oMA系統(tǒng),其中包括了幾何推理專家模塊。Mc引one和Shufelt(1994)在他們的系統(tǒng)中考慮了投影幾何,以用于建筑物提取,而Lang和Forstner(1996)在建筑物提取中應(yīng)用了多態(tài)特性.上下文信息在圖像理解起著重要的作用。特別在松弛標(biāo)記方法中,該方法用局部和全局上下文信息來進(jìn)行圖像區(qū)域或目標(biāo)標(biāo)記。經(jīng)過分割階段,場(chǎng)景標(biāo)記應(yīng)該與場(chǎng)景知識(shí)相對(duì)應(yīng),并且標(biāo)記應(yīng)該是一致的.這個(gè)問題用約束傳播的方法來解決.局部約束導(dǎo)致局部一致,并且通過迭代的方法,局部一致性與整幅圖像的一致性相協(xié)調(diào)。關(guān)于松弛標(biāo)記方法的詳細(xì)論述可以參考Hancock和Kittle:的文章。離散的松弛方法很簡(jiǎn)單,只能處理完整和精確的分割.概率松弛方法是建立在局部不一致性很可能全局解譯比一致很有價(jià)值但不易于解釋的基礎(chǔ)上的,可參見早期Rosenfeld等人(1976)關(guān)于這種方法的一個(gè)例子.為了處理匹配階段的不確定性,人們應(yīng)用了多種基于證據(jù)的技術(shù),例如:Dompstershafer理論,可靠性估計(jì),模糊邏輯,最小錯(cuò)誤原理,可信度估計(jì),隨機(jī)封閉集,貝葉斯網(wǎng)絡(luò)等.

4建模和表達(dá)方法應(yīng)用的一些例子

在計(jì)算機(jī)視覺和攝影測(cè)量與遙感領(lǐng)域中的知識(shí)表達(dá)和建模方法的應(yīng)用就是前述一些方法的具體化。這些應(yīng)用的領(lǐng)導(dǎo)者在理論上是機(jī)器械視覺的研究者。在攝影測(cè)量與遙感領(lǐng)域,所采用的方法緊隨計(jì)算機(jī)視覺領(lǐng)域之后,這些方法己經(jīng)改進(jìn)成信息提取的方法了.這些應(yīng)用表明攝影測(cè)量與遙感領(lǐng)域的研究者在人工智能技術(shù)上達(dá)到了專業(yè)水平。這些方法己經(jīng)從基于規(guī)則的系統(tǒng)發(fā)展到語義網(wǎng)絡(luò),從框架發(fā)展到邏輯描述。在這一部分,計(jì)算機(jī)視覺和攝影測(cè)量與遙感領(lǐng)域中的一些應(yīng)用的回顧就表明了這個(gè)趨勢(shì).4.1邏輯Reiter和Mackworth是第一批在計(jì)算機(jī)視覺系統(tǒng)中,應(yīng)用邏輯作為一種表達(dá)方式的研究者.在他們的著作中,他們提議用一個(gè)邏輯框架結(jié)構(gòu)來描述和解譯圖像和場(chǎng)景知識(shí),并且提出二者之間的形式映射關(guān)系。他們陳述了影像原理,場(chǎng)景原理和描述原則,這些原理的邏輯模型形成了影像的解譯。他們應(yīng)用一個(gè)稱為Mapse的簡(jiǎn)單地圖理解系統(tǒng)來說明他們的方法。雖然這種應(yīng)用具有相對(duì)的局限性,但是還沒有新的系統(tǒng)被報(bào)道。一個(gè)原因是計(jì)算方法的復(fù)雜性。當(dāng)邏輯提供一個(gè)一致的形式來說明約束,特定的研究使用邏輯的效率并不高。另外,FOL本身善長(zhǎng)描述數(shù)據(jù)的不確定性和不完整性,這些存在于圖像屬性之中。影像元素與影像對(duì)象之間的對(duì)應(yīng)并不是一對(duì)一的關(guān)系,另外的邏輯關(guān)系對(duì)這些模型是必要的。Matsuyama和Hwang采用了一個(gè)邏輯框架結(jié)構(gòu),在這種結(jié)構(gòu)中,動(dòng)態(tài)產(chǎn)生新的邏輯一致性和規(guī)則。4.2基于規(guī)則的產(chǎn)品系統(tǒng)Brooks研制了基于模型的影像理解系統(tǒng)一一ACRONYM系統(tǒng)用來檢測(cè)三維目標(biāo),并用它進(jìn)行了從航空影像上提取人工地物的實(shí)驗(yàn)。三維模型使用一個(gè)基于框架的表述來儲(chǔ)存。對(duì)提供的影像進(jìn)行了分析,ACRONYM系統(tǒng)提取了線段并獲得二維圓柱。幾何知識(shí)和圖像條件經(jīng)過編碼,形成規(guī)則被用來產(chǎn)生場(chǎng)景的三維模型,然后這些與框架相匹配以便識(shí)別人工地物。sIGMA是一種用框架來描述知識(shí),并且使用從上而下和從下而上兩種控制方案來提取特征的航空影像理解系統(tǒng)。它包括三個(gè)子系統(tǒng):幾何推理專家系統(tǒng)(GRE)、模型選擇專家系統(tǒng)(MSE)、低水平視覺專家系統(tǒng)(LIVE)。信息從GRE傳至MSE,然后同LIVE進(jìn)行通訊。SIGMA中的框架使用槽儲(chǔ)存一個(gè)對(duì)象的屬性和它與其他對(duì)象之間的關(guān)系。以框架中空間知識(shí)為基礎(chǔ),產(chǎn)生目標(biāo)的假設(shè)并用于影像特征相匹配。與目標(biāo)外形有關(guān)的推理,由MSE子系統(tǒng)來處理,并轉(zhuǎn)換成圖像術(shù)語傳遞給LIVE子系統(tǒng)。這種自上而下的影像屬性的選擇有利于檢測(cè)到一些小屬性,通過從航空影像中提取房屋和路段信息的實(shí)驗(yàn)對(duì)這個(gè)系統(tǒng)進(jìn)行了測(cè)試。Mckeown等提出一個(gè)基于規(guī)則的系統(tǒng),用來從航空?qǐng)D像上解譯飛機(jī)場(chǎng).這個(gè)系統(tǒng)以大約450條規(guī)則為基礎(chǔ),分為6組:初始化、用于原始圖像片段解譯的區(qū)域解譯、一致性檢查、組合圖像片段對(duì)功能區(qū)域的規(guī)則和用于建立機(jī)場(chǎng)模型的目標(biāo)生成規(guī)則.Mckeown和Harvey研制了稱為•schemata一個(gè)航空影像解譯系統(tǒng),該系統(tǒng)中包括一個(gè)從標(biāo)準(zhǔn)知識(shí)集編匯的一些規(guī)則。它們從較高的層次模式中自動(dòng)生成規(guī)則,這有利于更好地進(jìn)行錯(cuò)誤處理和更有效的操作。他們的系統(tǒng)包括大約100schemeta,其中每一個(gè)都會(huì)產(chǎn)生大約5個(gè)規(guī)則。start和Fischler提出了一個(gè)基于知識(shí)的系統(tǒng),用上下文信息進(jìn)行地形識(shí)別。在不同的層次上用規(guī)則對(duì)上下文進(jìn)行定義。上下文信息并不一定可靠,結(jié)果導(dǎo)致很多冗余.這個(gè)解譯系統(tǒng)是以三種規(guī)則為基礎(chǔ)的:候選結(jié)果,候選結(jié)果評(píng)價(jià),一致性確定。在評(píng)價(jià)過程中,候選結(jié)果的比較是基于可靠的候選結(jié)果評(píng)價(jià)的基礎(chǔ)上的,在這個(gè)過程中評(píng)價(jià)相關(guān)相似性,候選結(jié)果是這類結(jié)果中的一個(gè).作者認(rèn)為這樣劃分知識(shí)是為了使其成為便于操作的大小單元。Stilla等描述了一個(gè)基于模型的系統(tǒng),用來從航空影像中自動(dòng)提取建筑物信息,目標(biāo)既具有特殊性又具有一般性。該系統(tǒng)中用產(chǎn)品規(guī)則和產(chǎn)品描述集來對(duì)要識(shí)別的目標(biāo)進(jìn)行建模.特殊的模型用不變的拓?fù)溥壿嫿Y(jié)構(gòu)來描述目標(biāo),而一般的模型更具有普通性.這些系統(tǒng)說明基于規(guī)則的系統(tǒng)不能保證知識(shí)的添加性和推理的一致性。如果打破單一規(guī)則基礎(chǔ)而采用多尺度的多規(guī)則那么就會(huì)使程序模塊化程度降低,而且不易于更改。Draper等人建議用黑板系統(tǒng)和基于schema的結(jié)構(gòu)來處理之。4.3黑板系統(tǒng)Nagao和Matsuyama首先陳述了用黑板模型的影像理解的問題,并把它應(yīng)用到郊區(qū)的航空影像中,用于識(shí)別汽車、房屋、道路等。他們的系統(tǒng)包括全局的數(shù)據(jù)庫和一組知識(shí)源.黑板用層次方法記錄由:基本區(qū)域、典型區(qū)域和目標(biāo)等組成的數(shù)據(jù).黑板還存儲(chǔ)一個(gè)標(biāo)記圖,它連接原始影像的象素和數(shù)據(jù)庫中的相應(yīng)區(qū)域。基本區(qū)域是影像段分割的結(jié)果,并用灰度、尺寸、影像中的位置來標(biāo)記。然后區(qū)域中的獨(dú)特的特征被提取,識(shí)別的結(jié)果是具有下面的基本屬性的區(qū)域。1.依據(jù)區(qū)域尺寸,大的、同類的區(qū)域;2.依據(jù)區(qū)域形狀,長(zhǎng)的區(qū)域:3.依據(jù)區(qū)域光照,有陰影的區(qū)域;4.依據(jù)臨近區(qū)域的定位和太陽的定位,有陰影的區(qū)域;5.有植物和水的區(qū)域;6.根據(jù)紋理信息,高反差紋理區(qū)域。這些屬性以單獨(dú)的模式儲(chǔ)存在黑板上,然后根據(jù)不同區(qū)域的特殊特征存在或不存在,知識(shí)源會(huì)識(shí)別出一個(gè)特殊的目標(biāo).每種知識(shí)源都是一個(gè)規(guī)則,這些規(guī)則是在目標(biāo)識(shí)別的圖像處理操作過程中的一個(gè)條件或是復(fù)雜操作的一部分。例如,利用知識(shí)源檢洲莊稼地就是這樣:“如果”是大的同類的區(qū)域、植被區(qū)域、沒有水的區(qū)域、沒有光照源的區(qū)域,“那么”可以證明這片區(qū)域是莊稼地。每種知識(shí)源單獨(dú)識(shí)別一個(gè)目標(biāo),且這個(gè)可以導(dǎo)致同一個(gè)區(qū)域識(shí)別相互沖突(如莊稼地和草地)。為了解決這個(gè)問題,系統(tǒng)自動(dòng)地計(jì)算一個(gè)可靠值.然后,取可靠值最高的識(shí)別結(jié)果奮舍棄其他的識(shí)別結(jié)果。Fuger等描述了一個(gè)基于黑板的數(shù)據(jù)驅(qū)動(dòng)系統(tǒng)來分析航空影像中人工的目標(biāo).一般的目標(biāo)模型在黑板中用符號(hào)表達(dá),單個(gè)對(duì)象用幾個(gè)屬性描述.模型被許多參數(shù)所限制,這種參數(shù)被一個(gè)用“發(fā)展階段”的封閉的循環(huán)系統(tǒng)所決定。stilla提出一個(gè)基于黑板影像理解的系統(tǒng),這種系統(tǒng)適合于航空影像中復(fù)雜場(chǎng)景的結(jié)構(gòu)分析。從一個(gè)原始對(duì)象開始,反復(fù)使用中間結(jié)果,目標(biāo)對(duì)象就可以一步一步地組成。對(duì)象的組成用一個(gè)派生的圖表來表達(dá)和記錄.通過二維圖像的分割和直線的近似計(jì)算來進(jìn)行圖像的分析識(shí)別。黑板系統(tǒng)一般趨向于具有一個(gè)集中控制的結(jié)構(gòu),所以效率就成了問題。另外,黑板系統(tǒng)假設(shè)所需要的知識(shí)源是有效的,所以在計(jì)算機(jī)視覺應(yīng)用中應(yīng)用該方法前提是圖像已經(jīng)被分析過了。4.4框架Hanson和Rieman把框架作為假設(shè)的產(chǎn)生的機(jī)器。關(guān)于目標(biāo)分類的知識(shí)表達(dá)為框架。槽描述了目標(biāo)類別之間二進(jìn)制幾何關(guān)系。槽還包括例示其他的對(duì)象描述的產(chǎn)品規(guī)則,這樣,框架可用于控制又可用于表達(dá).Ikeuchi和kanade用來表達(dá)三維對(duì)象.當(dāng)明確了目標(biāo)模型是有用的,處理過程是自上而下的。然后,如果模型比較弱并且有較準(zhǔn)確的數(shù)據(jù),那么處理過程是自下而上的。其他使用框架的系統(tǒng)包括^eRONYM、sxGMA、Nagao和Matsuyama等人的系統(tǒng),這些己經(jīng)在上面介紹過了。4.5語義網(wǎng)絡(luò)Nicolin和Gabler描述了一個(gè)分析航空影像的系統(tǒng),該系統(tǒng)用語義網(wǎng)絡(luò)來表達(dá)和解譯圖像。系統(tǒng)由一個(gè)短期存儲(chǔ)器(STM)、一個(gè)方法庫(MB)、一個(gè)長(zhǎng)期存儲(chǔ)器(LTM)組成.5丁M的概念地等同于黑板,儲(chǔ)存影像解譯的部分結(jié)果.LTM存儲(chǔ)場(chǎng)景的先驗(yàn)知識(shí)和特殊領(lǐng)域知識(shí)。系統(tǒng)匹配STM的內(nèi)容和LTM的內(nèi)容來產(chǎn)生解譯結(jié)果.這個(gè)過程由MB中的推理機(jī)模塊來完成.STM最墓本的內(nèi)容是用一種自上而下的方式建立起來的,并且在一種模型驅(qū)動(dòng)階段狀態(tài)產(chǎn)生,校驗(yàn)LTM中存儲(chǔ)的目標(biāo)屬性的已有部分和缺少的部分。為了基于知識(shí)從數(shù)字地圖中提取目標(biāo),Ma}’er已經(jīng)發(fā)展了一個(gè)基于語義網(wǎng)絡(luò)的系統(tǒng)。該系統(tǒng)是建立在語義網(wǎng)絡(luò)和框架描述相結(jié)合的基礎(chǔ)上的,在控制上采用模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)相結(jié)合。模型是由三個(gè)層次組成的,一般與自上而下的影像處理過程的各自的層相一致:(l)影像層,如數(shù)字地圖;(2)影像圖表和文本層:(3)語義對(duì)象語義網(wǎng)絡(luò)以圖形層的部分元素為基礎(chǔ)構(gòu)建語義對(duì)象,這些對(duì)象構(gòu)成了圖形對(duì)象和地形對(duì)象之間的一般或特殊的關(guān)系.例如,一個(gè)圖表對(duì)象層中延長(zhǎng)的區(qū)域特征化為“路的兩邊”、“人行道”、“道路網(wǎng)”等.雖然其他對(duì)象的描述沒有給出,但是測(cè)試己證明了道路網(wǎng)的提取.用框架被設(shè)計(jì)來分析不同的概念和他們的屬性.對(duì)象的提取以模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)實(shí)例為基礎(chǔ),初始的研究以用戶確定的特定目標(biāo)為基礎(chǔ)的。雖然方法是以地圖上明確定義的信息提取為基礎(chǔ),但是M叮er認(rèn)為這個(gè)過程對(duì)影像信息的提取也是很有用的。Tonjes己使用語義網(wǎng)絡(luò)從重疊的航空影像來建立影像模型。輸出是具有適當(dāng)植被表示的三維景觀。Tonjes認(rèn)為語義網(wǎng)絡(luò)適用于表達(dá)結(jié)構(gòu)化目標(biāo)的知識(shí).它的語義網(wǎng)絡(luò)是用框架描述的,其中包括關(guān)系、屬性和方法。語義網(wǎng)絡(luò)有三個(gè)層:(l)傳感器圖層,該層從紋理,條帶和圖像細(xì)節(jié)為基礎(chǔ)描述分割層。(2)幾何和材料層,該層利用傳感和地形解譯結(jié)果來描述三維表面層。(3)影像層,它是要提取的對(duì)象。語義網(wǎng)絡(luò)建立在三層之間。目標(biāo)描述通過每層來重建,重建是基于數(shù)據(jù)驅(qū)動(dòng)和模型驅(qū)動(dòng)的。Lang和Forstner把他們的建筑物的提取方法建立在多態(tài)的中間層特征的基礎(chǔ)上。該方法中應(yīng)用了部分分層描述的語義模型。各部分之間的關(guān)系沒有包括在其中。結(jié)合應(yīng)用于頂點(diǎn)原始層的數(shù)據(jù)驅(qū)動(dòng)模型和用于目標(biāo)解譯、驗(yàn)證假設(shè)層的模型驅(qū)動(dòng)方法的基礎(chǔ)上,建立了建筑物假設(shè)層,應(yīng)用了四種建筑物類型:平屋頂、非直角平屋頂、人字形屋頂、曲線屋頂.sch川ing和vogtle開發(fā)了一個(gè)利用已知地圖庫輔助解譯的數(shù)字地圖史新系統(tǒng)。影像與地圖相比較,檢測(cè)出地圖自編輯以來的變化。接著,語義網(wǎng)絡(luò)分析新的特征。產(chǎn)生了兩個(gè)網(wǎng)絡(luò),一個(gè)用場(chǎng)景,另一個(gè)用于圖像,在其中網(wǎng)絡(luò)中的典型關(guān)系建立在不同的層次上.DoGunst提出了一個(gè)數(shù)據(jù)驅(qū)動(dòng)和模型驅(qū)動(dòng)相結(jié)合的方法,用來識(shí)別數(shù)字地圖更新所需的目標(biāo),這個(gè)方法是建立在用于道路描述的目標(biāo)導(dǎo)向模型和用于特征識(shí)別的基于框架的語義網(wǎng)絡(luò)基礎(chǔ)上的。框架詳細(xì)定義了目標(biāo)之間的關(guān)系,目標(biāo)的定義,可選的目標(biāo)定義和預(yù)處理關(guān)系。道路的細(xì)節(jié)包括復(fù)雜道路的結(jié)合點(diǎn),這些在知識(shí)庫中己被描述。這是一個(gè)包括幾個(gè)不同類型的道路特征的非常細(xì)節(jié)的研究。研究效果很明顯,但同時(shí)也表明解譯如此多細(xì)節(jié)存在著困難。Quint和sties在一996年,quint在1997年提出了一個(gè)叫MOSES的航空影像分析系統(tǒng),該系統(tǒng)用語義網(wǎng)絡(luò)作為建模工具,利用從地形圖和GIS數(shù)據(jù)中獲取的知識(shí)來自動(dòng)精練。地圖和圖像中的一般模型的概念是相應(yīng)的生成的模型概念的特例。對(duì)應(yīng)于特定的場(chǎng)景的特定模型由系統(tǒng)自動(dòng)產(chǎn)生:它是通過結(jié)合用圖像的一般模型進(jìn)行地圖分析而產(chǎn)生場(chǎng)景的描述而產(chǎn)生的。一開始,數(shù)字化的有用的線段用來作為地圖的結(jié)構(gòu)分析,從而獲取地圖的結(jié)構(gòu)分析結(jié)果。這樣,結(jié)果圖像一般模型來產(chǎn)生特殊模型,以用于圖像分析,對(duì)于結(jié)構(gòu)分析,原始影像用作輸入部分。分析是模型驅(qū)動(dòng)的,進(jìn)行目標(biāo)識(shí)別。在圖像分析處理中用價(jià)值函數(shù)指導(dǎo)研究。總結(jié)之,己發(fā)現(xiàn)語義網(wǎng)絡(luò)有很廣泛的應(yīng)用,并且己經(jīng)應(yīng)用于航空影像和數(shù)字地圖的解譯中.4.6描述邏輯邏輯描述的方法在攝影測(cè)量方面的應(yīng)用微乎其微.其中一個(gè)是Lang和schroder(1994)研制的基于描述邏輯的方法,利用該方法結(jié)合從地圖上提取的參考信息來解譯航空影像的變化。用KL一one相似描述邏輯來描述不同類型的目標(biāo)知識(shí)和可能的變化類型,它在必要和充足的條件下對(duì)概念進(jìn)行描述。用描述邏輯的描述模塊對(duì)有關(guān)場(chǎng)景和解譯的實(shí)際信息進(jìn)行描述。用目標(biāo)概念和變化概念在邏輯上描述空間地物的幾何關(guān)系和拓?fù)潢P(guān)系。目標(biāo)被認(rèn)為是經(jīng)過圖像處理和屬性提取后的目標(biāo)概念的一個(gè)實(shí)例。變化概念的概念被定義為識(shí)別變化.利用目標(biāo)導(dǎo)向和許多啟發(fā)式方法實(shí)現(xiàn)快速搜索。然而,這篇文章的例子似乎都以人工影像為基礎(chǔ)的。

篇7

因?yàn)樘嗟慕涣魇欠钦Z言性的,這就很容易理解為什么人與計(jì)算機(jī)交互會(huì)有障礙。我們經(jīng)歷了從打孔卡到鍵盤的發(fā)展,隨著諸如Siri等APP的興起,我們可以進(jìn)行語音輸入,但是僅僅通過語言,機(jī)器還是不能理解我們。

這就是為什么最近機(jī)器情緒識(shí)別的發(fā)展會(huì)如火如荼的原因。由于照相機(jī)技術(shù)和計(jì)算機(jī)視覺算法的發(fā)展,計(jì)算機(jī)通過面部表情、眼動(dòng)方式、肢體語言、說話方式甚至抬頭等理解我們的能力顯著提高。

想象一下:一位虛擬心理醫(yī)生在臨床診斷時(shí)可以通過分析患者的面部表情來確診抑郁癥,甚至可以隨著病情的變化來量化情緒變化。銷售人員能更好地分析客戶對(duì)其產(chǎn)品和廣告的反應(yīng),老師們能知道課程計(jì)劃是否適用于全體學(xué)生,智能手機(jī)如果感覺到我們不安或困惑,會(huì)改變方式并提出建議。

換句話說,冷靜的設(shè)備會(huì)通過我們的面部表情來得知我們的情緒。

計(jì)算機(jī)視覺研究者已經(jīng)致力于這項(xiàng)研究幾十年了。在這幾十年中發(fā)生了哪些改變?照相機(jī)技術(shù)是一個(gè)改變。為了理解面部表情,通常需要對(duì)表情的微妙變化進(jìn)行檢測(cè),比如臉頰肌肉、嘴部的變化以及挑眉。然而,直到最近,在許多網(wǎng)絡(luò)相機(jī)中人臉看起來還是像一大團(tuán)粉紅色的物質(zhì)。但是現(xiàn)在即使最原始的智能手機(jī)都具有高質(zhì)量的照相機(jī),能捕捉到諸多顯示面部情緒和意圖的面部動(dòng)作。

另一個(gè)變化是常規(guī)可用計(jì)算能力與內(nèi)存的提高,從而可以運(yùn)行更加復(fù)雜的情緒感知算法。由于有大量訓(xùn)練面部表情算法的視頻數(shù)據(jù)庫可用,計(jì)算機(jī)視覺算法變得越來越正確、有效,還能實(shí)時(shí)工作。

卡耐基梅隆大學(xué)機(jī)器人研究所的Fernando De la Torre發(fā)明了特別強(qiáng)大的面部識(shí)別軟件,被稱作IntraFace。他的團(tuán)隊(duì)采用機(jī)器學(xué)習(xí)的方法來教IntraFace如何以一種適用于大多數(shù)面孔的方式來識(shí)別和追蹤面部表情。然后他們創(chuàng)建了個(gè)性化算法能夠讓軟件對(duì)個(gè)人進(jìn)行情感表達(dá)分析。不僅準(zhǔn)確,而且高效,該軟件甚至能在手機(jī)上運(yùn)行。

De la Torre和匹茲堡大學(xué)心理學(xué)家Jeffrey Cohn已經(jīng)在臨床檢測(cè)抑郁癥上獲得了令人鼓舞的結(jié)果。在自然環(huán)境下檢測(cè)抑郁癥要求能夠捕捉微妙的面部表情,這就是他們正在做的事。

當(dāng)然,這并不是萬無一失的。演員可能會(huì)成功地偽造情感表達(dá)。但是,由于真假情緒在表達(dá)時(shí)間上的不一致,因此關(guān)注時(shí)間的算法不會(huì)輕易上當(dāng)。此外,面部表情是嵌入到其他非語言行為中的。Cohn和其同事發(fā)現(xiàn)嚴(yán)重抑郁癥和輕微抑郁癥之間在聲音的時(shí)間上有細(xì)微的差別。

另一位成員,語言技術(shù)研究所的Louis-Philipe Morency使用多模式機(jī)器學(xué)習(xí)來評(píng)估病人的非語言行為來幫助醫(yī)生更好地評(píng)估抑郁癥和焦慮。他設(shè)想這項(xiàng)技術(shù)不僅能幫助診斷疾病,還能在某種程度上量化情感反應(yīng),可以幫助醫(yī)生追蹤精神疾病,就像血液檢測(cè)和X射線能夠幫助醫(yī)生監(jiān)測(cè)身體疾病一樣。

如果機(jī)器能理解我們的情緒,我們與機(jī)器的交互就會(huì)變得更加豐富。卡耐基梅隆大學(xué)的Justine Cassell研究虛擬同伴在教育行業(yè)的應(yīng)用,她發(fā)現(xiàn)當(dāng)虛擬同伴能對(duì)學(xué)生們的情緒狀態(tài)做出適當(dāng)反應(yīng),甚至在某些場(chǎng)合嘲笑他們時(shí),學(xué)生們會(huì)更積極地參與也會(huì)學(xué)得更多。

篇8

關(guān)鍵詞:數(shù)字圖像技術(shù);應(yīng)用;發(fā)展趨勢(shì)

中圖分類號(hào):TP391.41

計(jì)算機(jī)的特點(diǎn)在于能夠處理各種數(shù)據(jù),數(shù)字圖像能夠經(jīng)過增強(qiáng)、復(fù)原、分割等處理,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展和進(jìn)步,現(xiàn)在的數(shù)字圖像技術(shù)具有圖像處理多樣性、精度高、圖像的再現(xiàn)性好、處理量大的優(yōu)點(diǎn),本文主要研究數(shù)字圖像處理技術(shù)的發(fā)展現(xiàn)狀和發(fā)展趨勢(shì)。

1 數(shù)字圖像處理技術(shù)研究現(xiàn)狀

所謂圖像處理是指利用計(jì)算機(jī)來處理圖像的過程,主要是實(shí)現(xiàn)改善圖像的視覺效果,研究的內(nèi)容主要包括圖像數(shù)字化、圖像增強(qiáng)、圖像還原以及圖像分割等。數(shù)字圖像處理最早來源于20世紀(jì)20年代的報(bào)紙業(yè),到20世紀(jì)50年代,隨著計(jì)算機(jī)的發(fā)展,數(shù)字圖像處理技術(shù)得到人們的普遍關(guān)注,數(shù)字圖像處理技術(shù)隨著太空計(jì)劃得到很大的發(fā)展,最具有典型的例子,是對(duì)月球照片的處理。

進(jìn)入到20世紀(jì)70年代后,數(shù)字圖像處理技術(shù)隨著計(jì)算機(jī)斷層掃面(CT)的出現(xiàn)得到發(fā)展,在以后的時(shí)間里,數(shù)字圖像處理技術(shù)不斷有新的研究成果,1975年EWI公司研究的CT裝置獲得諾貝爾獎(jiǎng),目前數(shù)字圖像技術(shù)已廣泛應(yīng)用在各行各業(yè)中。

2 數(shù)字圖像處理技術(shù)的應(yīng)用

數(shù)字圖像處理技術(shù)目前在各行各業(yè)中都得到了很大的進(jìn)展。在遙感航空航天方面,不少國家都派出了偵查飛機(jī)對(duì)目標(biāo)地區(qū)進(jìn)行空中攝影,進(jìn)而通過圖像處理技術(shù)來分析照片,節(jié)省了人力、物理,也能夠從圖片中得到其他的有用信息。在20世紀(jì)60年代以來,美國以及其他的一些國家發(fā)射了資源遙感衛(wèi)星,由于成像條件非常差,因此圖像本身的質(zhì)量也不高,需要采取數(shù)字圖像處理技術(shù)處理,如采用多波段掃描器進(jìn)行掃描成像,圖像分辨率為30m,這些圖像轉(zhuǎn)變?yōu)閿?shù)字信號(hào)傳送下來,再經(jīng)過處理。數(shù)字圖像處理技術(shù)在各國的應(yīng)用中已非常廣泛,如用在森林調(diào)查、災(zāi)害監(jiān)測(cè)、資源勘查以及城市規(guī)劃中。

數(shù)字圖像處理技術(shù)最早來源于醫(yī)藥方面,因此在生物醫(yī)學(xué)工程方面,數(shù)字圖像處理技術(shù)也發(fā)揮出了巨大作用,除了上文所講述的CT之外,還有一些顯微圖像處理技術(shù),主要是識(shí)別紅細(xì)胞、白細(xì)胞以及染色體分析等,在醫(yī)學(xué)診治方面X光肺圖像增強(qiáng)、心電圖分析以及超聲波圖像處理技術(shù)等發(fā)揮出了重要作用。

在通信工程方面,目前通信主要的發(fā)展趨勢(shì)為綜合性的多媒體通信,也就是將電視、計(jì)算機(jī)以及電話聯(lián)合在一起在數(shù)字通信網(wǎng)上傳輸,在傳輸?shù)倪^程中最為復(fù)雜和困難的地方集中在圖像的處理中,比如說,彩色電視信號(hào)速率為100Mbit/s以上,想要傳輸出去就需要壓縮信息的比特量,因此技術(shù)成敗的關(guān)鍵就在于編碼壓縮。目前國家正在大力研發(fā)的新的編碼方法,如小波變換圖像壓縮編碼以及自適應(yīng)圖像網(wǎng)絡(luò)編碼等。

在工業(yè)和工程方面,主要的應(yīng)用集中在自動(dòng)裝置配線中檢測(cè)零件的質(zhì)量、彈性力學(xué)照片的應(yīng)力分析以及郵政信件的自動(dòng)分檢等,另外在智能機(jī)器人中也有應(yīng)用。在軍事、公安方面,數(shù)字圖像處理技術(shù)的應(yīng)用主要集中在導(dǎo)彈的精確制導(dǎo)、偵查照片以及圖像的傳輸和顯示方面,在公安方面,主要應(yīng)用在鑒別人臉、識(shí)別指紋以及圖片復(fù)原方面。數(shù)字圖像處理技術(shù)除了以上所講述的應(yīng)用領(lǐng)域之外,在電視圖像的編輯、服裝設(shè)計(jì)、發(fā)型設(shè)計(jì)以及文物資料復(fù)原等方面也有廣泛的使用。

3 數(shù)字圖像處理技術(shù)的發(fā)展趨勢(shì)

目前數(shù)字圖像技術(shù)隨著科技的進(jìn)步得到了很大的發(fā)展,隨著低成本硬件相關(guān)技術(shù)的發(fā)展可以想象數(shù)字圖像技術(shù)將會(huì)得到更加廣泛的應(yīng)用,目前國內(nèi)的研究成果主要集中在一些診斷、圖像壓縮編碼以及目標(biāo)識(shí)別等方面,但是還沒有廣泛應(yīng)用在實(shí)際生活中。數(shù)字圖像處理技術(shù)將會(huì)向著高分辨率、立體化、超高速以及智能化等方面發(fā)展,下面具體講述數(shù)字圖像處理技術(shù)的發(fā)展趨勢(shì)。

隨著計(jì)算機(jī)、人工智能以及思維科學(xué)研究的不斷發(fā)展,數(shù)字圖像處理技術(shù)在計(jì)算機(jī)視覺方面將會(huì)進(jìn)一步的發(fā)展,智能機(jī)器人的重要感覺器官是視覺,目前研究的開放話題集中在理解和識(shí)別三維應(yīng)力,將會(huì)應(yīng)用在軍事勘察、危險(xiǎn)環(huán)境作業(yè)以及家庭服務(wù)等方面,目前人們對(duì)于自身的視覺了解的還非常少,因此在計(jì)算機(jī)視覺方面還需要進(jìn)一步的探索。

數(shù)字圖像處理技術(shù)還會(huì)向著虛擬現(xiàn)實(shí)發(fā)展,所謂虛擬現(xiàn)實(shí)就是使用計(jì)算機(jī)構(gòu)成一個(gè)虛擬的三維空間,這項(xiàng)技術(shù)的發(fā)展是在計(jì)算機(jī)硬件技術(shù)的提高方面提出的,人們應(yīng)用機(jī)器人身上的攝像機(jī)能夠真實(shí)的感受到所在的環(huán)境,進(jìn)而操縱機(jī)器人的行為,另外網(wǎng)上虛擬現(xiàn)實(shí)也是未來的一個(gè)發(fā)展方向。人們?cè)谕瓿缮鐣?huì)生產(chǎn)中往往習(xí)慣使用自身的認(rèn)識(shí)和工具,將這些掌握在自身手中,因此目前時(shí)代的發(fā)展趨勢(shì)就是將原來二維的東西向著三維發(fā)展,如三維重建技術(shù)在地圖方面的使用,在軍事方面能夠使用電子沙盤實(shí)現(xiàn)任意角度的轉(zhuǎn)化和計(jì)算,也能夠真實(shí)的直觀的反應(yīng)兩點(diǎn)之間的障礙物等,還能夠?qū)崿F(xiàn)模擬飛行路線,為作戰(zhàn)指揮帶來極大的便利。在計(jì)算機(jī)中進(jìn)行三維重建目前的熱點(diǎn)和難點(diǎn)問題主要是計(jì)算機(jī)視覺研究領(lǐng)域。在圖像壓縮、識(shí)別以及分割方面,目前已取得很大的研究進(jìn)展,目前圖像處理面臨的新的問題主要是圖像專業(yè)壓縮算法、圖像識(shí)別算法等。

4 結(jié)束語

綜上所述,本文先分析了數(shù)字圖像處理技術(shù)研究現(xiàn)狀和主要的應(yīng)用領(lǐng)域,進(jìn)而研究數(shù)字圖像技術(shù)的發(fā)展趨勢(shì)。目前數(shù)字圖像處理技術(shù)已廣泛的應(yīng)用在生活中,如在網(wǎng)絡(luò)、手機(jī)等中的應(yīng)用,數(shù)字圖像處理技術(shù)的發(fā)展與人們的生活息息相關(guān),隨著技術(shù)的不斷發(fā)展,數(shù)字圖像處理技術(shù)還會(huì)不斷得到進(jìn)步,這些還需要更多的人努力去研究。

參考文獻(xiàn):

[1]孔大力,崔洋.數(shù)字圖像處理技術(shù)的研究現(xiàn)狀與發(fā)展方向[J].山東水利職業(yè)學(xué)院院刊,2012(04):11-14.

[2]陳炳權(quán),劉宏立,孟凡斌.數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向[J].吉首大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(01):63-70.

[3]呂戈靜.淺談數(shù)字圖像處理技術(shù)的現(xiàn)狀及發(fā)展[J].電腦知識(shí)與技術(shù),2012(33):8035-8036.

[4]丁可.數(shù)字圖像處理技術(shù)研究與發(fā)展方向[J].經(jīng)濟(jì)研究導(dǎo)刊,2013(18):246+270.

篇9

一、數(shù)據(jù)融合

1.1概念的提出

1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號(hào)理解系統(tǒng)中得到了最早的體現(xiàn)。

7年代末,在公開的技術(shù)文獻(xiàn)中開始出現(xiàn)基于多系統(tǒng)的整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(dfs)定義數(shù)據(jù)融合為:“對(duì)多源的數(shù)據(jù)和信息進(jìn)行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進(jìn)行定位與估計(jì),并完全能對(duì)態(tài)勢(shì)及帶來的威脅進(jìn)行實(shí)時(shí)評(píng)估”。

1998年1月,buchroithner和wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個(gè)框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實(shí)際需要的信息”。

wald定義的數(shù)據(jù)融合的概念原理中,強(qiáng)調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標(biāo),這正是很多關(guān)于數(shù)據(jù)融合的文獻(xiàn)中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對(duì)用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項(xiàng)目的資金、人力資源等。

1.2基本內(nèi)容

信息融合是系統(tǒng)所具備的一個(gè)基本功能,人類本能地將各感官獲得的信息與先驗(yàn)知識(shí)進(jìn)行綜合,對(duì)周圍環(huán)境和發(fā)生的事件做出估計(jì)和判斷。當(dāng)運(yùn)用各種現(xiàn)代信息處理方法,通過計(jì)算機(jī)實(shí)現(xiàn)這一功能時(shí),就形成了數(shù)據(jù)融合技術(shù)。

數(shù)據(jù)融合就是充分利用多傳感器資源,通過對(duì)這些多傳感器及觀測(cè)信息的合理支配和使用,把多傳感器在空間或時(shí)間上的冗余或互補(bǔ)信息依據(jù)某些準(zhǔn)則進(jìn)行組合,以獲得被測(cè)對(duì)象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:

(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標(biāo)。

(2)多傳感器id/軌跡估計(jì)。假設(shè)多傳感器的報(bào)告反映的是同源目標(biāo),對(duì)這些數(shù)據(jù)進(jìn)行綜合,改進(jìn)對(duì)該目標(biāo)的估計(jì),或?qū)φ麄€(gè)當(dāng)前或未來情況的估計(jì)。

(3)采集管理。給定傳感器環(huán)境的一種認(rèn)識(shí)狀態(tài),通過分配多個(gè)信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標(biāo)探測(cè)、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識(shí)別、情況評(píng)估和預(yù)測(cè)。

根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個(gè)層次:

(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進(jìn)行關(guān)聯(lián)后,送入融合中心,完成對(duì)被測(cè)對(duì)象的綜合評(píng)價(jià)。其優(yōu)點(diǎn)是保持了盡可能多的原始信號(hào)信息,但是該種融合處理的信息量大、速度慢、實(shí)時(shí)性差,通常只用于數(shù)據(jù)之間配準(zhǔn)精度較高的圖像處理。

(2)特征層融合。從原始數(shù)據(jù)中提取特征,進(jìn)行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進(jìn)行分析與綜合,完成對(duì)被測(cè)對(duì)象的綜合評(píng)價(jià)。這種融合既保留了足夠數(shù)量的原始信息,又實(shí)現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實(shí)時(shí)處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯(cuò)性與可靠性有待進(jìn)一步改善。

(3)決策層融合。首先

每一傳感器分別獨(dú)立地完成特征提取和決策等任務(wù),然后進(jìn)行關(guān)聯(lián),再送入融合中心處理。這種方法的實(shí)質(zhì)是根據(jù)一定的準(zhǔn)則和每個(gè)決策的可信度做出最優(yōu)的決策。其優(yōu)點(diǎn)是數(shù)據(jù)通訊量小、實(shí)時(shí)性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個(gè)或幾個(gè)傳感器失效時(shí),系統(tǒng)仍能繼續(xù)工作,具有良好的容錯(cuò)性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個(gè)熱點(diǎn)。但是這種技術(shù)也有不足,如原始信息的損失、被測(cè)對(duì)象的時(shí)變特征、先驗(yàn)知識(shí)的獲取困難,以及知識(shí)庫的巨量特性等。

1.3處理模型

美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當(dāng)時(shí)僅應(yīng)用于軍事方面,但該模型對(duì)人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個(gè)模塊的基本功能如下:

數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗(yàn)知識(shí)等)。

源數(shù)據(jù)預(yù)處理。進(jìn)行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計(jì)算負(fù)擔(dān),有時(shí)需要為融合中心提供最重要的數(shù)據(jù)。目標(biāo)評(píng)估。融合目標(biāo)的位置、速度、身份等參數(shù),以達(dá)到對(duì)這些參數(shù)的精確表達(dá)。主要包括數(shù)據(jù)配準(zhǔn)、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識(shí)。

態(tài)勢(shì)評(píng)估。根據(jù)當(dāng)前的環(huán)境推斷出檢測(cè)目標(biāo)與事件之間的關(guān)系,以判斷檢測(cè)目標(biāo)的意圖。威脅評(píng)估。結(jié)合當(dāng)前的態(tài)勢(shì)判斷對(duì)方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時(shí)考慮當(dāng)前的環(huán)境和對(duì)敵策略等因素,所以較為困難。

處理過程評(píng)估。監(jiān)視系統(tǒng)的性能,辨識(shí)改善性能所需的數(shù)據(jù),進(jìn)行傳感器資源的合理配置。人機(jī)接口。提供人與計(jì)算機(jī)間的交互功能,如人工操作員的指導(dǎo)和評(píng)價(jià)、多媒體功能等。

二、多傳感器在林業(yè)中的應(yīng)用

2.1在森林防火中的應(yīng)用

在用modis(moderateresolutionimagingspectroradiometer)數(shù)據(jù)測(cè)定森林火點(diǎn)時(shí)的2、22、23波段的傳感器輻射值已達(dá)飽和狀態(tài),用一般圖像增強(qiáng)處理方法探測(cè)燃燒區(qū)火點(diǎn)的結(jié)果不理想。余啟剛運(yùn)用數(shù)據(jù)融合技術(shù),在空間分辨率為1m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為25m的可見光通道的數(shù)據(jù),較好地進(jìn)行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對(duì)火點(diǎn)位置的判斷準(zhǔn)確度。為進(jìn)一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準(zhǔn)確性與可靠性,利用原有森林防火用的林區(qū)紅外探測(cè)器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計(jì)算機(jī)獲得gps接收機(jī)輸出的有關(guān)信息通過與rs實(shí)現(xiàn)高效互補(bǔ)性融合,從而彌補(bǔ)衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點(diǎn)信息準(zhǔn)確度和敏感性。

2.2森林蓄積特征的估計(jì)

hampusholmstrom等在瑞典南部的試驗(yàn)區(qū)將spot-4×s衛(wèi)星數(shù)據(jù)和carabas-iivhfsar傳感器的雷達(dá)數(shù)據(jù)進(jìn)行了融合,采用knn(knearestneighbor)方法對(duì)森林的蓄積特征(林分蓄積、樹種組成與年齡)進(jìn)行了估計(jì)。

knn方法就是采用目標(biāo)樣地鄰近k個(gè)(k=1)最近樣地的加權(quán)來估計(jì)目標(biāo)樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達(dá)數(shù)據(jù)融合技術(shù)對(duì)試驗(yàn)區(qū)的不同林分的蓄積特征進(jìn)行估計(jì),并對(duì)三種不同的數(shù)據(jù)方法進(jìn)行誤差分析。試驗(yàn)表明,融合后的數(shù)據(jù)作出的估計(jì)比單一的衛(wèi)星數(shù)據(jù)或雷達(dá)數(shù)據(jù)的精度高且穩(wěn)定性好。

2.3用非垂直航空攝像數(shù)據(jù)融合gis信息更新調(diào)查數(shù)據(jù)

森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森

林資源調(diào)查的工作量巨大,且要花費(fèi)大量的人力、物力和資金。國內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計(jì)方法。 trevorjdavis等22年提出采用非垂直的航空攝影數(shù)據(jù)融合對(duì)應(yīng)的gis數(shù)據(jù)信息實(shí)現(xiàn)森林調(diào)查數(shù)據(jù)

的快速更新,認(rèn)為對(duì)森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機(jī)側(cè)面裝上可視的數(shù)字?jǐn)z像裝置,利用gps對(duì)測(cè)點(diǎn)進(jìn)行定位,對(duì)特殊地區(qū)的攝像進(jìn)行拍攝,同時(shí)與對(duì)應(yīng)的gis數(shù)據(jù)進(jìn)行融合,做出資源變化的估計(jì)或影像的修正。

試驗(yàn)表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費(fèi)少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠(yuǎn)、地形復(fù)雜、不易操作、成本高的區(qū)域,同時(shí)可避免遙感圖像受云層遮蓋。

三、數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望

3.1在木材檢測(cè)中的應(yīng)用

3.1.1木材缺陷及其影響

木材是天然生長(zhǎng)的有機(jī)體,生長(zhǎng)過程中不可避免地有尖削度、彎曲度、節(jié)子等生長(zhǎng)缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強(qiáng)度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識(shí)別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識(shí)別起來非常困難,勞動(dòng)強(qiáng)度大,效率低,同時(shí)由于熟練程度、標(biāo)準(zhǔn)掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識(shí)別嚴(yán)重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進(jìn)行在線識(shí)別和自動(dòng)剔除技術(shù),以解決集成材加工中節(jié)子人工識(shí)別誤差大、難以實(shí)現(xiàn)雙面識(shí)別、剔除機(jī)械調(diào)整時(shí)間長(zhǎng)等問題。

3.1.2單一傳感器在木材檢測(cè)中的應(yīng)用

對(duì)木材及人造板進(jìn)行無損檢測(cè)的方法很多,如超聲波、微波、射線、機(jī)械應(yīng)力、震動(dòng)、沖擊應(yīng)力波、快速傅立葉變換分析等檢測(cè)方法。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等。

隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測(cè)中。新西蘭科學(xué)家用視頻傳感器研究和測(cè)量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時(shí)準(zhǔn)確地測(cè)量單個(gè)纖維和全部纖維的幾何尺寸及其變化趨勢(shì),能夠區(qū)分不同紙漿類型,測(cè)定木材纖維材料加固結(jié)合力,并動(dòng)態(tài)地觀察木材纖維在材料中的結(jié)合機(jī)理。

新西蘭的基于視覺傳感器的板材缺陷識(shí)別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機(jī)或激光掃描儀采集板材的圖像,自動(dòng)識(shí)別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進(jìn)行原木三維模型真實(shí)再現(xiàn)的計(jì)算機(jī)視覺識(shí)別功能,利用激光掃描儀自動(dòng)采集原木的三維幾何數(shù)據(jù)。

美國林產(chǎn)品實(shí)驗(yàn)室利用計(jì)算機(jī)視覺技術(shù)對(duì)木材刨花的尺寸大小進(jìn)行分級(jí),確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進(jìn)行了定向刨花板內(nèi)刨花定向程度的檢測(cè),從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強(qiáng)度。

在制材加工過程中,利用計(jì)算機(jī)視覺技術(shù)在線實(shí)時(shí)檢測(cè)原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時(shí)可對(duì)鋸材的質(zhì)量進(jìn)行分級(jí),實(shí)現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計(jì)算機(jī)視覺技術(shù)在線實(shí)時(shí)檢測(cè)單板上的各種缺陷,實(shí)現(xiàn)單板的智能和自動(dòng)剪切,并可測(cè)量在剪切過程中的單板破損率,對(duì)單板進(jìn)行分等分級(jí),實(shí)現(xiàn)自動(dòng)化生產(chǎn)過程。wengert等在綜合了大量的板材分類經(jīng)驗(yàn)的基礎(chǔ)上,建立了板材分級(jí)分類的計(jì)算機(jī)視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計(jì)算機(jī)視覺技術(shù)對(duì)刨花板施膠效果進(jìn)行了定量分析。

x射線對(duì)木材及木質(zhì)復(fù)合材料的性能檢測(cè)已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對(duì)木材密度、含水率、纖維素相對(duì)結(jié)晶度和結(jié)晶區(qū)大小、纖維的結(jié)構(gòu)和性質(zhì)等進(jìn)行檢測(cè),并對(duì)木材內(nèi)部的各種缺陷進(jìn)行檢測(cè)。

3.1.3數(shù)據(jù)融合在木材檢測(cè)中的應(yīng)用展望

單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項(xiàng)技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測(cè)到有些與木材具有相同顏色的節(jié)子,有時(shí)會(huì)把木板上的臟物或油脂當(dāng)成節(jié)子,

造成誤判,有時(shí)也會(huì)受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測(cè)部分表面缺陷,而無法檢測(cè)到內(nèi)部缺陷;超聲、微波、核磁共振和x射線技術(shù)均能測(cè)量密度及內(nèi)部特征,但是它們不能測(cè)定木材的顏色和瑕疵,因?yàn)檫@些缺陷的密度往往同木板相同。因此,一個(gè)理想的檢測(cè)系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準(zhǔn)確、可靠地檢測(cè)到木材的缺陷。

基于多傳感器(機(jī)器視覺及x射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測(cè),可以集成多個(gè)傳統(tǒng)單項(xiàng)技術(shù),更可靠、準(zhǔn)確地實(shí)時(shí)檢測(cè)出木材表面的各種缺陷,為實(shí)現(xiàn)木材分級(jí)自動(dòng)化、智能化奠定基礎(chǔ),同時(shí)為集裁除鋸、自動(dòng)調(diào)整、自動(dòng)裁除節(jié)子等為一身的新型視頻識(shí)別集成材雙面節(jié)子數(shù)控自動(dòng)剔除成套設(shè)備提供技術(shù)支持。

3.2在精確林業(yè)中的應(yīng)用

美國華盛頓大學(xué)研究人員開展了樹形自動(dòng)分析、林業(yè)作業(yè)規(guī)劃等研究工作;auburn大學(xué)的生物系統(tǒng)工程系和usda南方林業(yè)實(shí)驗(yàn)站與有關(guān)公司合作開展用gps和其他傳感器研究林業(yè)機(jī)器系統(tǒng)的性能和生產(chǎn)效率。

篇10

關(guān)鍵詞:智能科學(xué)與技術(shù)專業(yè);課程體系;教材建設(shè)

繼2004年北京大學(xué)率先在國內(nèi)建立“智能科學(xué)與技術(shù)”本科專業(yè)之后,2005年,北京郵電大學(xué)、南開大學(xué)和西安電子科技大學(xué);2006年,首都師范大學(xué)、北京信息科技大學(xué)、武漢工程大學(xué)和西安郵電學(xué)院;2007年,北京科技大學(xué)、廈門大學(xué)和湖南大學(xué);2008年,河北工業(yè)大學(xué)和桂林電子科技大學(xué);2009年,重慶郵電大學(xué)和大連海事大學(xué);2010年,中南大學(xué)和上海理工大學(xué)先后經(jīng)教育部批準(zhǔn)先后設(shè)立了“智能科學(xué)與技術(shù)”本科專業(yè)[1-2]。在中國人工智能學(xué)會(huì)教育工作委員會(huì)的指導(dǎo)下,自2002年起,各相關(guān)專業(yè)教師定期召開智能科學(xué)與技術(shù)教育學(xué)術(shù)研討會(huì),并出版教育論文專輯,大力推進(jìn)了我國智能科學(xué)與技術(shù)教育的健康、快速發(fā)展,并對(duì)我國智能科學(xué)技術(shù)的人才培養(yǎng)和學(xué)科建設(shè)起到了極大的帶動(dòng)作用。

作為一個(gè)發(fā)展中的新興專業(yè),目前各高校仍主要結(jié)合自身基礎(chǔ)和特點(diǎn)建設(shè)該專業(yè)。如南開大學(xué)以智能技術(shù)與智能工程為核心專業(yè)課程[3];北京科技大學(xué)從社會(huì)需求角度出發(fā),以提高學(xué)生軟件實(shí)踐能力為切入點(diǎn)[4];河北工業(yè)大學(xué)根據(jù)相關(guān)專業(yè)的就業(yè)現(xiàn)狀,以提高學(xué)生硬件實(shí)踐能力為著力點(diǎn)[5]。為了解決南開大學(xué)、北京科技大學(xué)和河北工業(yè)大學(xué)3所高校共同面臨的課程體系和教材建設(shè)等問題,三校教師分別于2010年6月16日和8月2日在南開大學(xué)、河北工業(yè)大學(xué)進(jìn)行了兩次研討,現(xiàn)將研討成果匯總于此。

1研討背景

“智能科學(xué)與技術(shù)”專業(yè)自開辦以來,不可避免地要回答如下3個(gè)方面的問題:

1) 來自用人單位的問題:“智能科學(xué)與技術(shù)”專業(yè)是做什么的?與其他專業(yè)相比優(yōu)勢(shì)何在?

2) 來自學(xué)生及家長(zhǎng)的問題:“智能科學(xué)與技術(shù)”專業(yè)是學(xué)什么的?與其他專業(yè)相比優(yōu)勢(shì)何在?

3) 來自教師自身的問題:“智能科學(xué)與技術(shù)”專業(yè)應(yīng)該教什么?與其他專業(yè)相比優(yōu)勢(shì)何在?

無論是做什么、學(xué)什么還是教什么,歸根到底是課程體系和教材內(nèi)容。無論是研究生課程下移(帶來學(xué)生接受知識(shí)的困難),還是在其他專業(yè)教學(xué)體系基礎(chǔ)上做簡(jiǎn)單的增、刪、改(帶來學(xué)生知識(shí)結(jié)構(gòu)的凌亂),都是不行的,長(zhǎng)此以往的后果將是沒有優(yōu)勢(shì),只有劣勢(shì)。

南開大學(xué)、北京科技大學(xué)和河北工業(yè)大學(xué)3所高校的“智能科學(xué)與技術(shù)”專業(yè)建設(shè)都源于自動(dòng)化專業(yè)基礎(chǔ),而且都具有典型的工科特色;同時(shí)3所高校分別是教育部直屬“985”高校、教育部直屬國家“優(yōu)勢(shì)學(xué)科創(chuàng)新平臺(tái)”建設(shè)項(xiàng)目試點(diǎn)高校和河北省屬“211”高校,3所高校的“智能科學(xué)與技術(shù)”專業(yè)分別于2006、2007和2008年招生。3所高校在“智能科學(xué)與技術(shù)”專業(yè)建設(shè)上的異同特點(diǎn)以及地域便利的條件,為優(yōu)勢(shì)互補(bǔ)、交流融合提供了機(jī)遇。

2課程體系

根據(jù)研究任務(wù)的不同,智能科學(xué)技術(shù)涵蓋的內(nèi)容可以劃分為智能科學(xué)、智能技術(shù)、智能工程三個(gè)層次[6]。

1) 智能科學(xué):主要任務(wù)是研究人的智慧,建立人機(jī)結(jié)合系統(tǒng)理論,并用其模擬人的智慧。

2) 智能技術(shù):在智能科學(xué)的框架內(nèi)創(chuàng)建人機(jī)結(jié)合智能系統(tǒng)所需要的方法、工具和技術(shù)。

3) 智能工程:利用智能科學(xué)的理念和思想,充分運(yùn)用智能技術(shù)工具創(chuàng)建各種應(yīng)用系統(tǒng)。它是當(dāng)前新技術(shù)、新產(chǎn)品、新產(chǎn)業(yè)的重要發(fā)展方向、開發(fā)策略和顯著標(biāo)志。

根據(jù)上述智能科學(xué)技術(shù)的劃分,智能科學(xué)與技術(shù)專業(yè)的課程體系同樣劃分為理論、技術(shù)與工程應(yīng)用3個(gè)層次,具體框架如圖1所示。

需要說明的是,由于課時(shí)、學(xué)時(shí)等因素的限制,有些課程需要包含未列入課程的部分內(nèi)容。如智能科學(xué)與技術(shù)概論課程內(nèi)含系統(tǒng)論的簡(jiǎn)要介紹;智能控制系統(tǒng)包含可編程序控制器、智能傳感器、智能執(zhí)行器等內(nèi)容;智能工程包含若干典型智能系統(tǒng)實(shí)例。

3教材建設(shè)

經(jīng)南開大學(xué)、北京科技大學(xué)和河北工業(yè)大學(xué)3所高校的討論,一致認(rèn)為工科專業(yè)應(yīng)以技術(shù)和工程應(yīng)用兩個(gè)層次為核心,并將人工智能導(dǎo)論和智能信息處理兩門課程的教材合并為智能技術(shù)。同時(shí),根據(jù)南開大學(xué)側(cè)重理論、北京科技大學(xué)側(cè)重軟件、河北工業(yè)大學(xué)側(cè)重硬件的原則進(jìn)行分工,編寫對(duì)應(yīng)課程的教學(xué)大綱和教材內(nèi)容。

3.1智能技術(shù)

本課程包括智能計(jì)算和計(jì)算機(jī)視覺兩部分,分別介紹以對(duì)人腦的物理結(jié)構(gòu)進(jìn)行模擬為主要特征的聯(lián)接主義智能技術(shù)和以模擬人類視覺處理為主要特征的計(jì)算機(jī)視覺兩部分。它是智能技術(shù)的主干內(nèi)容;也是實(shí)現(xiàn)智能技術(shù)、組成智能系統(tǒng)的重要工具,屬于本專業(yè)本科生的專業(yè)基礎(chǔ)課。通過智能技術(shù)的學(xué)習(xí),學(xué)生應(yīng)能夠掌握智能技術(shù)的基本原理和方法。通過課堂講解、,并配合一定的作業(yè)練習(xí)、上機(jī)實(shí)驗(yàn)等環(huán)節(jié),學(xué)生應(yīng)初步具備運(yùn)用智能技術(shù)和方法分析和解決問題的能力。本課程擬定90學(xué)時(shí),其中授課54學(xué)時(shí),實(shí)驗(yàn)36學(xué)時(shí)。

教材內(nèi)容包括智能計(jì)算和計(jì)算機(jī)視覺兩部分,智能計(jì)算部分包括神經(jīng)網(wǎng)絡(luò)、模糊理論和遺傳算法/蟻群算法,計(jì)算機(jī)視覺包括計(jì)算機(jī)視覺導(dǎo)論、計(jì)算機(jī)視覺理論基礎(chǔ)、圖像預(yù)處理、圖像分割、物體識(shí)別、圖像理解、雙目立體視覺、三維視覺技術(shù)、主動(dòng)視覺。

神經(jīng)網(wǎng)絡(luò)講授單個(gè)神經(jīng)元(感知器)的動(dòng)作原理,與實(shí)際生物神經(jīng)元的對(duì)應(yīng)關(guān)系;講授BP神經(jīng)網(wǎng)絡(luò)的組成,網(wǎng)絡(luò)的特性和對(duì)非線性函數(shù)的模擬功能;介紹BP算法的優(yōu)、缺點(diǎn);講授H網(wǎng)絡(luò)的組成結(jié)構(gòu),H網(wǎng)絡(luò)在解決優(yōu)化問題的優(yōu)越性。模糊理論講授模糊集合的概念,建立隸屬度函數(shù)的概念;介紹模糊規(guī)則的建立原則,模糊規(guī)則與模糊系統(tǒng)收入輸出量之間的關(guān)系;介紹模糊化以及模糊量精確化的幾種常用方法。遺傳算法和蟻群算法只作簡(jiǎn)要介紹,重點(diǎn)介紹這兩種算法的特點(diǎn)和成功的應(yīng)用實(shí)例,使學(xué)習(xí)者有一個(gè)感性認(rèn)識(shí),明確這種類型算法的“迭代”特點(diǎn)以及總體最優(yōu)目標(biāo)與個(gè)體行為之間的聯(lián)系。

計(jì)算機(jī)視覺理論基礎(chǔ)主要介紹Marr的視覺計(jì)算理論、圖像的相關(guān)知識(shí)、傅立葉變換基礎(chǔ);圖像預(yù)處理主要介紹像素亮度變換、幾何變換、直方圖修正、局部預(yù)處理、圖像復(fù)原;圖像分割主要介紹閾值處理方法、基于邊界的分割方法、基于區(qū)域的分割方法;形狀表示與描述主要介紹鏈碼、使用片斷序列描述邊界、尺度空間方法、基于區(qū)域的形狀表示與描述;物體識(shí)別主要介紹知識(shí)的表示、統(tǒng)計(jì)模式識(shí)別、神經(jīng)元網(wǎng)絡(luò)、遺傳算法、模擬退火、模糊系統(tǒng);圖像理解主要介紹并行和串行處理控制、分層控制、非分層控制;雙目立體視覺主要介紹雙目立體視覺原理、精度分析、系統(tǒng)結(jié)構(gòu)、立體成像、立體匹配、系統(tǒng)標(biāo)定;三維視覺技術(shù)主要介紹結(jié)構(gòu)光三維視覺原理、光模式投射系統(tǒng)、標(biāo)定方法、光度立體視覺、由紋理恢復(fù)形狀、激光測(cè)距法;主動(dòng)視覺主要介紹從陰影恢復(fù)形狀、從運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)、主動(dòng)跟蹤。

3.2智能控制理論與技術(shù)

本課程是“智能科學(xué)與技術(shù)”專業(yè)的一門重要專業(yè)課程,目的是使學(xué)生了解智能科學(xué)與控制理論結(jié)合所產(chǎn)生之智能控制理論的基本概念和應(yīng)用價(jià)值;使學(xué)生熟知當(dāng)前主流智能控制技術(shù)的種類,并掌握模糊控制、神經(jīng)網(wǎng)絡(luò)控制以及進(jìn)化計(jì)算、群體智能的基礎(chǔ)知識(shí),了解智能技術(shù)與傳統(tǒng)控制方法的結(jié)合點(diǎn);加強(qiáng)MATLAB仿真實(shí)驗(yàn)的訓(xùn)練,以使學(xué)生更好地理解基礎(chǔ)知識(shí),培養(yǎng)學(xué)生使用高級(jí)智能控制方法解決實(shí)際控制問題的能力。本課程的學(xué)習(xí)將使學(xué)生加深對(duì)控制理論的理解,明晰智能技術(shù)在控制中的應(yīng)用技巧,也為本科生繼續(xù)深造打下基礎(chǔ)。本課程擬定64學(xué)時(shí),其中授課54學(xué)時(shí),實(shí)驗(yàn)10學(xué)時(shí)。

教材內(nèi)容包括智能控制概論,介紹智能控制的發(fā)展歷程和應(yīng)用領(lǐng)域,簡(jiǎn)介幾種重要的智能控制方法;專家控制,簡(jiǎn)介專家系統(tǒng)的基本結(jié)構(gòu),講授專家PID控制器的原理與設(shè)計(jì)方法;模糊控制,講授模糊數(shù)學(xué)基礎(chǔ)知識(shí)、傳統(tǒng)的模糊控制原理和控制器設(shè)計(jì)與實(shí)現(xiàn)方法、模糊PID控制的兩種形式,特別是PID控制參數(shù)的模糊整定技術(shù);神經(jīng)網(wǎng)絡(luò)控制,講授前饋神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)中幾種典型的網(wǎng)絡(luò)模型以及學(xué)習(xí)算法、基于神經(jīng)網(wǎng)絡(luò)的線性系統(tǒng)辨識(shí)技術(shù)、神經(jīng)網(wǎng)絡(luò)逆模控制等;進(jìn)化計(jì)算與控制,講授進(jìn)化計(jì)算的概念、遺傳算法的原理及其與其他智能方法的結(jié)合,介紹遺傳機(jī)器人學(xué);群體智能與控制,講授蟻群算法的基本原理及其在控制問題中的應(yīng)用,介紹群體機(jī)器人學(xué)。

3.3單片機(jī)原理與應(yīng)用

本課程是“智能科學(xué)與技術(shù)”專業(yè)的一門專業(yè)課程,目的是使學(xué)生了解單片機(jī)的組成原理及常用控制算法的實(shí)現(xiàn);掌握51系列單片機(jī)指令系統(tǒng)和一般匯編程序設(shè)計(jì)編寫方法;熟悉常用的單片機(jī)硬件擴(kuò)展技術(shù);在此基礎(chǔ)上,熟練掌握控制算法的單片機(jī)程序編寫與調(diào)試。本課程擬定54學(xué)時(shí),其中授課38學(xué)時(shí),實(shí)驗(yàn)16學(xué)時(shí)。

教材內(nèi)容包括單片機(jī)系統(tǒng)概述,介紹單片機(jī)定義、單片機(jī)發(fā)展過程及單片機(jī)硬件結(jié)構(gòu);單片機(jī)指令系統(tǒng)及程序設(shè)計(jì),介紹指令系統(tǒng)和匯編語言程序設(shè)計(jì);硬件資源及接口技術(shù),介紹硬件資源和接口技術(shù);單片機(jī)使用技術(shù),介紹抗干擾技術(shù)、C語言應(yīng)用程序設(shè)計(jì);依次介紹PID控制器、狀態(tài)反饋控制器、模糊控制器、系統(tǒng)辨識(shí)、卡爾曼濾波、滑??刂破?、最優(yōu)控制器、魯棒控制器、自適應(yīng)控制器、神經(jīng)網(wǎng)絡(luò)控制器的歷史沿革、基本原理、常用形式和單片機(jī)具體實(shí)現(xiàn)方法。

3.4嵌入式系統(tǒng)

本課程以當(dāng)前主流的嵌入式系統(tǒng)技術(shù)為背景,以嵌入式系統(tǒng)原理為基礎(chǔ),以嵌入式系統(tǒng)開發(fā)體系為骨架,以嵌入式控制系統(tǒng)開發(fā)為目標(biāo),較為全面地介紹嵌入式系統(tǒng)的基本概念、軟硬件的基本體系結(jié)構(gòu)、軟硬件開發(fā)方法、相關(guān)開發(fā)工具、應(yīng)用領(lǐng)域、熱門領(lǐng)域的開發(fā)實(shí)例以及當(dāng)前的一些前沿動(dòng)態(tài),為學(xué)生展示較為完整的嵌入式控制系統(tǒng)領(lǐng)域概況。本課程擬定64學(xué)時(shí),其中授課48學(xué)時(shí),實(shí)驗(yàn)16學(xué)時(shí)。

教材依據(jù)嵌入式控制系統(tǒng)的特征,將控制算法、嵌入式系統(tǒng)硬件、操作系統(tǒng)、應(yīng)用程序設(shè)計(jì)及組態(tài)軟件作為統(tǒng)一的技術(shù)平臺(tái)介紹,突出嵌入式技術(shù)在控制系統(tǒng)中應(yīng)用的特點(diǎn),重點(diǎn)介紹嵌入式控制系統(tǒng)軟硬件、電路、操作系統(tǒng)、實(shí)時(shí)性、可靠性等特性,從軟件體系結(jié)構(gòu)及開發(fā)的角度出發(fā),強(qiáng)調(diào)實(shí)時(shí)調(diào)度、Bootloader、BSP、嵌入式實(shí)時(shí)多任務(wù)系統(tǒng)設(shè)計(jì)、交叉開發(fā)與仿真開發(fā)等關(guān)鍵技術(shù),并特別引入了工業(yè)控制中需要的電磁兼容性設(shè)計(jì)和大量的典型嵌入式控制系統(tǒng)實(shí)例設(shè)計(jì)。通過本課程的學(xué)習(xí),學(xué)生不但可以學(xué)會(huì)使用工具開發(fā)嵌入式軟硬件,而且可以從總體角度選擇適當(dāng)?shù)募夹g(shù)和方法,全面規(guī)劃和設(shè)計(jì)嵌入式系統(tǒng)。

3.5智能工程

本課程是“智能科學(xué)與技術(shù)”專業(yè)的一門核心專業(yè)課程。面向智能技術(shù)的實(shí)際應(yīng)用,著眼于解決工程應(yīng)用中的技術(shù)問題,從典型系統(tǒng)設(shè)計(jì)案例分析出發(fā),通過大量實(shí)驗(yàn)提高學(xué)生的工程實(shí)踐能力。本課程擬定36學(xué)時(shí),全部為授課學(xué)時(shí)。

教材內(nèi)容包括智能工程概論,介紹智能工程現(xiàn)狀、工程設(shè)計(jì)原則和工程實(shí)際流程;常用傳感器原理,介紹傳感器一般特性、光電式傳感器和視覺傳感器;典型智能系統(tǒng)設(shè)計(jì)案例,包括智能移動(dòng)機(jī)器人、智能電梯群控電梯等系統(tǒng)。

3.6智能機(jī)器人

課程通過對(duì)一個(gè)具有代表性的仿人機(jī)器人的拆解,將知識(shí)點(diǎn)拆解成6個(gè)主要教學(xué)模塊:1)機(jī)器人控制模塊,介紹各類控制模塊的原理與組成;2)機(jī)器人運(yùn)動(dòng)系統(tǒng),介紹電機(jī)與舵機(jī)的原理與控制方法;3)機(jī)器人動(dòng)作系統(tǒng),介紹機(jī)器人各部件的協(xié)調(diào)控制;4)機(jī)器人視覺系統(tǒng),介紹典型的超聲波、影像傳感器的原理與識(shí)別算法;5)機(jī)器人表現(xiàn)系統(tǒng)原理,介紹人與機(jī)器人的交互原理;6)機(jī)器人通信系統(tǒng)原理,介紹機(jī)器人之間的數(shù)據(jù)與信息傳遞方法。學(xué)生學(xué)習(xí)時(shí),能夠與基礎(chǔ)知識(shí)相聯(lián)系,并能掌握機(jī)器人這門技術(shù),為從事機(jī)器人產(chǎn)品研發(fā)工作打下堅(jiān)實(shí)的基礎(chǔ)。本課程擬定54學(xué)時(shí),其中授課44學(xué)時(shí),實(shí)驗(yàn)10學(xué)時(shí)。

教材面向“智能科學(xué)與技術(shù)”專業(yè),同時(shí)兼顧信息類專業(yè)學(xué)生編寫,根據(jù)這類專業(yè)學(xué)生的知識(shí)結(jié)構(gòu)和特點(diǎn)組織內(nèi)容。從具體的機(jī)器人控制需求出發(fā),將自動(dòng)控制的基本理論和機(jī)器人控制特點(diǎn)相結(jié)合,講授機(jī)器人控制系統(tǒng)的組成、規(guī)律、特點(diǎn)和設(shè)計(jì)方法。理論上反映當(dāng)前的最新進(jìn)展,內(nèi)容上考慮初學(xué)者的需求,側(cè)重普及性、實(shí)用性和新穎性,結(jié)構(gòu)體系符合信息類和控制類專業(yè)學(xué)生的特點(diǎn),力求簡(jiǎn)潔、清楚,對(duì)技術(shù)的敘述遵循目標(biāo)、問題、理論依據(jù)、實(shí)現(xiàn)方法、實(shí)際情況、發(fā)展方向的方式。做到重點(diǎn)突出,符合實(shí)際,滿足需要,指導(dǎo)性強(qiáng)。

3.7智能控制系統(tǒng)

本課程是“智能科學(xué)與技術(shù)”專業(yè)的一門專業(yè)課程,使學(xué)生了解智能控制系統(tǒng)的基礎(chǔ)知識(shí);掌握智能控制系統(tǒng)中最新的智能傳感技術(shù)、智能控制器、智能執(zhí)行能執(zhí)行器及智能網(wǎng)絡(luò)與接口技術(shù);掌握智能控制系統(tǒng)中多個(gè)關(guān)鍵硬件裝置的識(shí)別及其使用。通過學(xué)習(xí)多個(gè)智能控制系統(tǒng)的開發(fā)實(shí)例,學(xué)生應(yīng)掌握智能控制系統(tǒng)的設(shè)計(jì)方法與技術(shù),堅(jiān)實(shí)地掌握最新智能控制系統(tǒng)知識(shí),提高理論聯(lián)系實(shí)際的能力,并為學(xué)習(xí)其他課程的打下堅(jiān)實(shí)基礎(chǔ)。本課程擬定64學(xué)時(shí),其中授課48學(xué)時(shí),實(shí)驗(yàn)16學(xué)時(shí)。

教材內(nèi)容包括概述,介紹智能控制系統(tǒng)的基本概念、基本內(nèi)容和機(jī)構(gòu)及其發(fā)展趨勢(shì);智能傳感系統(tǒng),講授智能數(shù)據(jù)采集技術(shù)、傳感器智能化的數(shù)據(jù)處理方法、多傳感器信息融合的方法、智能傳感器實(shí)現(xiàn)方法與典型實(shí)例;智能控制器設(shè)計(jì),講授基于單片機(jī)的智能控制器設(shè)計(jì)及其應(yīng)用、基于高性能嵌入式ARM的智能控制器設(shè)計(jì)及其應(yīng)用、基于PLC的智能控制器設(shè)計(jì)及其應(yīng)用;智能電動(dòng)執(zhí)行器,講授智能電動(dòng)執(zhí)行器的硬件實(shí)現(xiàn)技術(shù),軟件設(shè)計(jì)技術(shù)以及典型的智能電動(dòng)執(zhí)行器實(shí)例及其應(yīng)用;智能網(wǎng)絡(luò)與接口技術(shù),講授無線傳感器智能網(wǎng)絡(luò),工業(yè)現(xiàn)場(chǎng)總線網(wǎng)絡(luò)以及智能傳感器、智能控制器和智能執(zhí)行器的網(wǎng)絡(luò)接口實(shí)現(xiàn)技術(shù);智能控制系統(tǒng)設(shè)計(jì)實(shí)例,綜合利用前面的知識(shí)設(shè)計(jì)網(wǎng)絡(luò)化智能壓力傳感器的系統(tǒng)設(shè)計(jì)、基于聲音定位的智能機(jī)器人系統(tǒng)設(shè)計(jì)、基于微機(jī)電慣性傳感器的汽車多路況智能防撞系統(tǒng)的設(shè)計(jì)、大型設(shè)備的PLC智能控制系統(tǒng)設(shè)計(jì)。

4結(jié)語

通過南開大學(xué)、北京科技大學(xué)和河北工業(yè)大學(xué)3所高校的研討,我們凝練出較完整的“智能科學(xué)與技術(shù)”專業(yè)課程體系,體現(xiàn)出本專業(yè)的特色;提出可供3所高校共同使用的教學(xué)大綱和教材內(nèi)容,體現(xiàn)出學(xué)生培養(yǎng)的工程實(shí)踐導(dǎo)向。這些研究成果可以為開辦“智能科學(xué)與技術(shù)”專業(yè)的兄弟院校進(jìn)一步研討提供藍(lán)本,也可以為籌建該專業(yè)的高校所參考。

注:本文受到北京科技大學(xué)教學(xué)研究會(huì)第六批教學(xué)研究課題、北京科技大學(xué)教育教學(xué)研究基金青年教師教育教學(xué)研究立項(xiàng)項(xiàng)目、河北工業(yè)大學(xué)教改項(xiàng)目(2010-12)支持。

參考文獻(xiàn):

[1] 王萬森,鐘義信,韓力群,等. 我國智能科學(xué)技術(shù)教育的現(xiàn)狀與思考[J]. 計(jì)算機(jī)教育,2009(11):10-14.

[2] 教育部關(guān)于公布2009年度高等學(xué)校專業(yè)設(shè)置備案或?qū)徟Y(jié)果的通知[S]. 教高〔2010〕2號(hào),2010.

[3] 方勇純,劉景泰. 南開大學(xué)“智能科學(xué)與技術(shù)”專業(yè)教學(xué)體系與實(shí)驗(yàn)環(huán)境建設(shè)[J]. 計(jì)算機(jī)教育,2009(11):21-25.

[4] 石志國,劉冀偉,王志良.“智能科學(xué)與技術(shù)”本科專業(yè)軟件實(shí)踐類課程建設(shè)探討[J]. 計(jì)算機(jī)教育,2009(11):93-97.

[5] 劉作軍,張磊,楊鵬,等. 談我校增設(shè)“智能科學(xué)與技術(shù)”專業(yè)的設(shè)想與措施[J]. 計(jì)算機(jī)教育,2009(11):53-56.

[6] 盧桂章. 無處不在的智能技術(shù)[J]. 計(jì)算機(jī)教育,2009(11):68-72.

A Study on the Course System and Textbook Construction for the Discipline of

Intelligence Science and Technology

YANG Peng1, ZHANG Jian-xun2, LIU Ji-wei3, ZHANG Lei1

(1. Hebei University of Technology, Tianjin 300130, China; 2.Nankai University, Tianjin 300071, China;

3. University of Science and Technology Beijing, Beijing 100083, China)