知名百科  > 所屬分類  >  科技百科    百科詞條   

計(jì)算機(jī)視覺

計(jì)算機(jī)視覺(Computer Vision)是指研究使機(jī)器具有“看”的能力的一門技術(shù)。狹義地講,計(jì)算機(jī)視覺就是通過分析攝像機(jī)獲取的圖像來達(dá)到對(duì)物體形成表達(dá)的科學(xué)和技術(shù)。與圖像理解,視頻分析、模式識(shí)別有密切的聯(lián)系,但都有所區(qū)別。 

計(jì)算機(jī)視覺計(jì)算機(jī)視覺
目錄

發(fā)展歷程 編輯本段

計(jì)算機(jī)視覺經(jīng)歷了以下四個(gè)主要發(fā)展歷程:

1、馬爾視覺計(jì)算理論1982年馬爾視覺計(jì)算理論(參見視覺計(jì)算理論)的提出,標(biāo)志著計(jì)算機(jī)視覺成為了一門獨(dú)立的學(xué)科。馬爾視覺計(jì)算理論包含兩個(gè)主要觀點(diǎn):首先,馬爾認(rèn)為人類視覺的主要功能是復(fù)原三維場(chǎng)景的可見幾何表面,即三維重建問題。其次,馬爾認(rèn)為這種從二維圖像到三維幾何結(jié)構(gòu)的復(fù)原過程是可以通過計(jì)算完成的,并提出了從圖像初始略圖(sketch)→物體2.5維描述→物體3維描述一套完整的計(jì)算理論和方法。

2、主動(dòng)視覺,目的視覺針對(duì)馬爾理論在具體應(yīng)用中遇到的困難。以Y.Aloimonos,R.Bajcsy等為代表的學(xué)者在20世紀(jì)80年代末90年代初提出了“目的視覺”、“主動(dòng)視覺”、“定性視覺”等理論,這些理論的共同特點(diǎn)是認(rèn)為,馬爾理論從下到上的三維重建過程由于缺乏目的性,缺乏高層知識(shí)反饋,從而導(dǎo)致三維重建框架不可行。重建算法不魯棒,他們強(qiáng)調(diào)視覺算法高層知識(shí)反饋的必要性和重要性,以及視覺主體與環(huán)境交互的重要性,這些理論盡管從原理上來說更加符合人類視覺過程。但由于“利用什么樣的高層知識(shí)”,“如何利用高層知識(shí)”,“視覺主體如何與環(huán)境進(jìn)行有效交互”等這些核心問題目前人們還知之甚少。在近期內(nèi)估計(jì)還很難建立有效的計(jì)算模型,所以這些理論自從1994年在CV-GIP:Image Understanding上組織關(guān)于主動(dòng)視覺的大辯論后,至今仍沒有顯著性進(jìn)展。

3、分層重建理論(stratified reconstruction)以O(shè).Faugeras和R.Hartley等提出的分層重建理論是20世紀(jì)90年代計(jì)算機(jī)視覺領(lǐng)域最活躍的研究?jī)?nèi)容。分層重建的基本思想是指從圖像到三維歐幾里得空間的重建過程中,先從圖像空間得到射影空間下的重建(11個(gè)未知數(shù)),然后將射影空間下重建的結(jié)果提升到仿射空間(3未知數(shù)),最后將仿射空間下重建的結(jié)果提升到歐幾里得空間(5個(gè)未知數(shù)),這種分層重建方法由于每一步重建過程中涉及的未知變量少。幾何意義明確,所以算法的魯棒性得到了有效提高。

4、基于學(xué)習(xí)的視覺物體識(shí)別是計(jì)算機(jī)視覺的重要研究?jī)?nèi)容,隨著基于圖像的物體表達(dá)(View Based Representation)的提出和機(jī)器學(xué)習(xí)" data-id="337489" contenteditable="false" class="bk-color-link" data-type="innerLink" data-href="#" data-wiki-doc-id="4233444799058361039" data-source="1" data-content="[{"type":"text","text":"機(jī)器學(xué)習(xí)"}]">機(jī)器學(xué)習(xí)的進(jìn)展,基于學(xué)習(xí)的視覺是近年來計(jì)算機(jī)視覺的研究熱點(diǎn)。所謂基于學(xué)習(xí)的視覺,就是指利用機(jī)器學(xué)習(xí)的手段來對(duì)圖像物體進(jìn)行識(shí)別的方法。包括對(duì)物體的識(shí)別和分類(object identification and categorization)。

視覺原理 編輯本段

計(jì)算機(jī)視覺

計(jì)算機(jī)視覺就是用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段,由計(jì)算機(jī)來代替大腦完成處理和解釋。計(jì)算機(jī)視覺的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。要經(jīng)過長(zhǎng)期的努力才能達(dá)到的目標(biāo)。因此,在實(shí)現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺系統(tǒng),這個(gè)系統(tǒng)能依據(jù)視覺敏感和反饋的某種程度的智能完成一定的任務(wù)。例如,計(jì)算機(jī)視覺的一個(gè)重要應(yīng)用領(lǐng)域就是自主車輛的視覺導(dǎo)航,還沒有條件實(shí)現(xiàn)象人那樣能識(shí)別和理解任何環(huán)境,完成自主導(dǎo)航的系統(tǒng)。因此,人們努力的研究目標(biāo)是實(shí)現(xiàn)在高速公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。這里要指出的一點(diǎn)是在計(jì)算機(jī)視覺系統(tǒng)中計(jì)算機(jī)起代替人腦的作用,但并不意味著計(jì)算機(jī)必須按人類視覺的方法完成視覺信息的處理。計(jì)算機(jī)視覺可以而且應(yīng)該根據(jù)計(jì)算機(jī)系統(tǒng)的特點(diǎn)來進(jìn)行視覺信息的處理。但是,人類視覺系統(tǒng)是迄今為止,人們所知道的功能最強(qiáng)大和完善的視覺系統(tǒng)。如在以下的章節(jié)中會(huì)看到的那樣,對(duì)人類視覺處理機(jī)制的研究將給計(jì)算機(jī)視覺的研究提供啟發(fā)和指導(dǎo)。因此,用計(jì)算機(jī)信息處理的方法研究人類視覺的機(jī)理,建立人類視覺的計(jì)算理論,也是一個(gè)非常重要和信人感興趣的研究領(lǐng)域。這方面的研究被稱為計(jì)算視覺(Computational Vision)。計(jì)算機(jī)視覺可被認(rèn)為是計(jì)算機(jī)視覺中的一個(gè)研究領(lǐng)域。

發(fā)展現(xiàn)狀 編輯本段

計(jì)算機(jī)視覺領(lǐng)域的突出特點(diǎn)是其多樣性與不完善性。這一領(lǐng)域的先驅(qū)可追溯到更早的時(shí)候,但是直到20世紀(jì)70年代后期,當(dāng)計(jì)算機(jī)的性能提高到足以處理諸如圖像這樣的大規(guī)模數(shù)據(jù)時(shí),計(jì)算機(jī)視覺才得到了正式的關(guān)注和發(fā)展。然而這些發(fā)展往往起源于其他不同領(lǐng)域的需要,因而何謂“計(jì)算機(jī)視覺問題”始終沒有得到正式定義,很自然地,“計(jì)算機(jī)視覺問題”應(yīng)當(dāng)被如何解決也沒有成型的公式。

盡管如此,人們已開始掌握部分解決具體計(jì)算機(jī)視覺任務(wù)的方法,可惜這些方法通常都僅適用于一群狹隘的目標(biāo)(如:臉孔、指紋、文字等),因而無法被廣泛地應(yīng)用于不同場(chǎng)合。

對(duì)這些方法的應(yīng)用通常作為某些解決復(fù)雜問題的大規(guī)模系統(tǒng)的一個(gè)組成部分(例如醫(yī)學(xué)圖像的處理,工業(yè)制造中的質(zhì)量控制與測(cè)量)。在計(jì)算機(jī)視覺的大多數(shù)實(shí)際應(yīng)用當(dāng)中,計(jì)算機(jī)被預(yù)設(shè)為解決特定的任務(wù),然而基于機(jī)器學(xué)習(xí)的方法正日漸普及,一旦機(jī)器學(xué)習(xí)的研究進(jìn)一步發(fā)展,未來“泛用型”的電腦視覺應(yīng)用或許可以成真。

人工智能所研究的一個(gè)主要問題是:如何讓系統(tǒng)具備“計(jì)劃”和“決策能力”?從而使之完成特定的技術(shù)動(dòng)作(例如:移動(dòng)一個(gè)機(jī)器人通過某種特定環(huán)境)。這一問題便與計(jì)算機(jī)視覺問題息息相關(guān)。在這里,計(jì)算機(jī)視覺系統(tǒng)作為一個(gè)感知器,為決策提供信息。另外一些研究方向包括模式識(shí)別和機(jī)器學(xué)習(xí)(這也隸屬于人工智能領(lǐng)域,但與計(jì)算機(jī)視覺有著重要聯(lián)系),也由此,計(jì)算機(jī)視覺時(shí)常被看作人工智能與計(jì)算機(jī)科學(xué)的一個(gè)分支。

物理是與計(jì)算機(jī)視覺有著重要聯(lián)系的另一領(lǐng)域。

計(jì)算機(jī)視覺關(guān)注的目標(biāo)在于充分理解電磁波——主要是可見光與紅外線部分——遇到物體表面被反射所形成的圖像,而這一過程便是基于光學(xué)物理和固態(tài)物理,一些尖端的圖像感知系統(tǒng)甚至?xí)?yīng)用到量子力學(xué)理論,來解析影像所表示的真實(shí)世界。同時(shí),物理學(xué)中的很多測(cè)量難題也可以通過計(jì)算機(jī)視覺得到解決,例如流體運(yùn)動(dòng)。也由此,計(jì)算機(jī)視覺同樣可以被看作是物理學(xué)的拓展。

另一個(gè)具有重要意義的領(lǐng)域是神經(jīng)生物學(xué),尤其是其中生物視覺系統(tǒng)的部分。

在整個(gè)20世紀(jì)中,人類對(duì)各種動(dòng)物的眼睛、神經(jīng)元、以及與視覺刺激相關(guān)的腦部組織都進(jìn)行了廣泛研究,這些研究得出了一些有關(guān)“天然的”視覺系統(tǒng)如何運(yùn)作的描述(盡管仍略嫌粗略),這也形成了計(jì)算機(jī)視覺中的一個(gè)子領(lǐng)域——人們?cè)噲D建立人工系統(tǒng),使之在不同的復(fù)雜程度上模擬生物的視覺運(yùn)作。同時(shí)計(jì)算機(jī)視覺領(lǐng)域中,一些基于機(jī)器學(xué)習(xí)的方法也有參考部分生物機(jī)制。

計(jì)算機(jī)視覺的另一個(gè)相關(guān)領(lǐng)域是信號(hào)處理。很多有關(guān)單元變量信號(hào)的處理方法,尤其是對(duì)時(shí)變信號(hào)的處理,都可以很自然的被擴(kuò)展為計(jì)算機(jī)視覺中對(duì)二元變量信號(hào)或者多元變量信號(hào)的處理方法。但由于圖像數(shù)據(jù)的特有屬性,很多計(jì)算機(jī)視覺中發(fā)展起來的方法,在單元信號(hào)的處理方法中卻找不到對(duì)應(yīng)版本。這類方法的一個(gè)主要特征,便是他們的非線性以及圖像信息的多維性,以上二點(diǎn)作為計(jì)算機(jī)視覺的一部分,在信號(hào)處理學(xué)中形成了一個(gè)特殊的研究方向。

除了上面提到的領(lǐng)域,很多研究課題同樣可被當(dāng)作純粹的數(shù)學(xué)問題。例如,計(jì)算機(jī)視覺中的很多問題,其理論基礎(chǔ)便是統(tǒng)計(jì)學(xué),最優(yōu)化理論以及幾何學(xué)。

如何使既有方法通過各種軟硬件實(shí)現(xiàn),或說如何對(duì)這些方法加以修改,而使之獲得合理的執(zhí)行速度而又不損失足夠精度,是現(xiàn)今電腦視覺領(lǐng)域的主要課題。

應(yīng)用范圍 編輯本段

人類正在進(jìn)入信息時(shí)代,計(jì)算機(jī)將越來越廣泛地進(jìn)入幾乎所有領(lǐng)域。一方面是更多未經(jīng)計(jì)算機(jī)專業(yè)訓(xùn)練的人也需要應(yīng)用計(jì)算機(jī),而另一方面是計(jì)算機(jī)的功能越來越強(qiáng),使用方法越來越復(fù)雜。這就使人在進(jìn)行交談和通訊時(shí)的靈活性與在使用計(jì)算機(jī)時(shí)所要求的嚴(yán)格和死板之間產(chǎn)生了尖銳的矛盾。人可通過視覺和聽覺,語言與外界交換信息,并且可用不同的方式表示相同的含義,而計(jì)算機(jī)卻要求嚴(yán)格按照各種程序語言來編寫程序,只有這樣計(jì)算機(jī)才能運(yùn)行。為使更多的人能使用復(fù)雜的計(jì)算機(jī),必須改變過去的那種讓人來適應(yīng)計(jì)算機(jī),來死記硬背計(jì)算機(jī)的使用規(guī)則的情況。而是反過來讓計(jì)算機(jī)來適應(yīng)人的習(xí)慣和要求,以人所習(xí)慣的方式與人進(jìn)行信息交換,也就是讓計(jì)算機(jī)具有視覺、聽覺和說話等能力。這時(shí)計(jì)算機(jī)必須具有邏輯推理和決策的能力。具有上述能力的計(jì)算機(jī)就是智能計(jì)算機(jī)。

智能計(jì)算機(jī)不但使計(jì)算機(jī)更便于為人們所使用,同時(shí)如果用這樣的計(jì)算機(jī)來控制各種自動(dòng)化裝置特別是智能機(jī)器人,就可以使這些自動(dòng)化系統(tǒng)和智能機(jī)器人具有適應(yīng)環(huán)境,和自主作出決策的能力。這就可以在各種場(chǎng)合取代人的繁重工作,或代替人到各種危險(xiǎn)和惡劣環(huán)境中完成任務(wù)。

應(yīng)用范圍從任務(wù),比如工業(yè)機(jī)器視覺系統(tǒng),比方說,檢查瓶子上的生產(chǎn)線加速通過,研究為人工智能和計(jì)算機(jī)或機(jī)器人,可以理解他們周圍的世界。計(jì)算機(jī)視覺和機(jī)器視覺領(lǐng)域有顯著的重疊。計(jì)算機(jī)視覺涉及的被用于許多領(lǐng)域自動(dòng)化圖像分析的核心技術(shù)。機(jī)器視覺通常指的是結(jié)合自動(dòng)圖像分析與其他方法和技術(shù),以提供自動(dòng)檢測(cè)和機(jī)器人指導(dǎo)在工業(yè)應(yīng)用中的一個(gè)過程。在許多計(jì)算機(jī)視覺應(yīng)用中,計(jì)算機(jī)被預(yù)編程,以解決特定的任務(wù),但基于學(xué)習(xí)的方法現(xiàn)在正變得越來越普遍。計(jì)算機(jī)視覺應(yīng)用的實(shí)例包括用于系統(tǒng):

(1)控制過程,比如,一個(gè)工業(yè)機(jī)器人;

(2)導(dǎo)航,例如,通過自主汽車或移動(dòng)機(jī)器人;

(3)檢測(cè)的事件,如,對(duì)視頻監(jiān)控和人數(shù)統(tǒng)計(jì);

(4)組織信息,例如,對(duì)于圖像和圖像序列的索引數(shù)據(jù)庫;

(5)造型對(duì)象或環(huán)境,如,醫(yī)學(xué)圖像分析系統(tǒng)或地形模型;

(6)相互作用,例如,當(dāng)輸入到一個(gè)裝置,用于計(jì)算機(jī)人的交互;

(7)自動(dòng)檢測(cè),例如,在制造業(yè)的應(yīng)用程序。

其中最突出的應(yīng)用領(lǐng)域是醫(yī)療計(jì)算機(jī)視覺和醫(yī)學(xué)圖像處理。這個(gè)區(qū)域的特征的信息從圖像數(shù)據(jù)中提取用于使患者的醫(yī)療診斷的目的。通常,圖像數(shù)據(jù)是在形式顯微鏡圖像,X射線圖像,血管造影圖像,超聲圖像和斷層圖像。的信息,可以從這樣的圖像數(shù)據(jù)中提取的一個(gè)例子是檢測(cè)的腫瘤,動(dòng)脈粥樣硬化或其他惡性變化。它也可以是器官的尺寸,血流量等。這種應(yīng)用領(lǐng)域還支持通過提供新的信息,醫(yī)學(xué)研究的測(cè)量例如,對(duì)腦的結(jié)構(gòu),或約醫(yī)學(xué)治療的質(zhì)量。計(jì)算機(jī)視覺在醫(yī)療領(lǐng)域的應(yīng)用還包括增強(qiáng)是由人類的解釋,例如超聲圖像或X射線圖像,以降低噪聲的影響的圖像。

計(jì)算機(jī)視覺計(jì)算機(jī)視覺呈現(xiàn)

第二個(gè)應(yīng)用程序區(qū)域中的計(jì)算機(jī)視覺是在工業(yè),有時(shí)也被稱為機(jī)器視覺,在那里信息被提取為支撐的制造工序的目的。一個(gè)例子是質(zhì)量控制,其中的信息或最終產(chǎn)品被以找到缺陷自動(dòng)檢測(cè)。另一個(gè)例子是,被拾取的位置和細(xì)節(jié)取向測(cè)量由機(jī)器人臂。機(jī)器視覺也被大量用于農(nóng)業(yè)的過程,從散裝材料,這個(gè)過程被稱為去除不想要的東西,食物的光學(xué)分揀。

軍事上的應(yīng)用很可能是計(jì)算機(jī)視覺最大的地區(qū)之一。最明顯的例子是探測(cè)敵方士兵或車輛和導(dǎo)彈制導(dǎo)。更先進(jìn)的系統(tǒng)為導(dǎo)彈制導(dǎo)發(fā)送導(dǎo)彈的區(qū)域,而不是一個(gè)特定的目標(biāo),并且當(dāng)導(dǎo)彈到達(dá)基于本地獲取的圖像數(shù)據(jù)的區(qū)域的目標(biāo)做出選擇?,F(xiàn)代軍事概念,如“戰(zhàn)場(chǎng)感知”,意味著各種傳感器,包括圖像傳感器,提供了豐富的有關(guān)作戰(zhàn)的場(chǎng)景,可用于支持戰(zhàn)略決策的信息。在這種情況下,數(shù)據(jù)的自動(dòng)處理,用于減少?gòu)?fù)雜性和融合來自多個(gè)傳感器的信息,以提高可靠性。

一個(gè)較新的應(yīng)用領(lǐng)域是自主車,其中包括潛水,陸上車輛(帶輪子,轎車或卡車的小機(jī)器人),高空作業(yè)車和無人機(jī)(UAV)。自主化水平,從完全獨(dú)立的(無人)的車輛范圍為汽車,其中基于計(jì)算機(jī)視覺的系統(tǒng)支持驅(qū)動(dòng)程序或在不同情況下的試驗(yàn)。完全自主的汽車通常使用計(jì)算機(jī)視覺進(jìn)行導(dǎo)航時(shí),即知道它在哪里,或用于生產(chǎn)的環(huán)境(地圖SLAM)和用于檢測(cè)障礙物。它也可以被用于檢測(cè)特定任務(wù)的特定事件,例如,一個(gè)UAV尋找森林火災(zāi)。支承系統(tǒng)的例子是障礙物警報(bào)系統(tǒng)中的汽車,以及用于飛行器的自主著陸系統(tǒng)。數(shù)家汽車制造商已經(jīng)證明了系統(tǒng)的汽車自動(dòng)駕駛,但該技術(shù)還沒有達(dá)到一定的水平,就可以投放市場(chǎng)。有軍事自主車型,從先進(jìn)的導(dǎo)彈,無人機(jī)的偵察任務(wù)或?qū)椀闹茖?dǎo)充足的例子。太空探索已經(jīng)正在使用計(jì)算機(jī)視覺,自主車比如,美國(guó)宇航局的火星探測(cè)漫游者和歐洲航天局的ExoMars火星漫游者。

其他應(yīng)用領(lǐng)域包括:

(1)支持視覺特效制作的電影和廣播,例如,攝像頭跟蹤(運(yùn)動(dòng)匹配)。

(2)監(jiān)視。

結(jié)構(gòu)系統(tǒng) 編輯本段

計(jì)算機(jī)視覺系統(tǒng)的結(jié)構(gòu)形式很大程度上依賴于其具體應(yīng)用方向。有些是獨(dú)立工作的,用于解決具體的測(cè)量或檢測(cè)問題;也有些作為某個(gè)大型復(fù)雜系統(tǒng)的組成部分出現(xiàn),比如和機(jī)械控制系統(tǒng),數(shù)據(jù)庫系統(tǒng),人機(jī)接口設(shè)備協(xié)同工作。計(jì)算機(jī)視覺系統(tǒng)的具體實(shí)現(xiàn)方法同時(shí)也由其功能決定——是預(yù)先固定的抑或是在運(yùn)行過程中自動(dòng)學(xué)習(xí)調(diào)整。盡管如此,有些功能卻幾乎是每個(gè)計(jì)算機(jī)系統(tǒng)都需要具備的。

圖像獲取 編輯本段

一幅數(shù)字圖像是由一個(gè)或多個(gè)圖像感知器產(chǎn)生,這里的感知器可以是各種光敏攝像機(jī),包括遙感設(shè)備,X射線斷層攝影儀,雷達(dá),超聲波接收器等。取決于不同的感知器,產(chǎn)生的圖片可以是普通的二維圖像,三維圖組或者一個(gè)圖像序列。圖片的像素值往往對(duì)應(yīng)于光在一個(gè)或多個(gè)光譜段上的強(qiáng)度(灰度圖或彩色圖),但也可以是相關(guān)的各種物理數(shù)據(jù),如聲波,電磁波或核磁共振的深度,吸收度或反射度。

預(yù)處理 編輯本段

在對(duì)圖像實(shí)施具體的計(jì)算機(jī)視覺方法來提取某種特定的信息前,一種或一些預(yù)處理往往被采用來使圖像滿足后繼方法的要求。例如:

二次取樣保證圖像坐標(biāo)的正確;

平滑去噪來濾除感知器引入的設(shè)備噪聲;

提高對(duì)比度來保證實(shí)現(xiàn)相關(guān)信息可以被檢測(cè)到;

調(diào)整尺度空間使圖像結(jié)構(gòu)適合局部應(yīng)用。

特征提取 編輯本段

從圖像中提取各種復(fù)雜度的特征。例如:

線,邊緣提?。?/p>

局部化的特征點(diǎn)檢測(cè)如邊角檢測(cè),斑點(diǎn)檢測(cè);

更復(fù)雜的特征可能與圖像中的紋理形狀或運(yùn)動(dòng)有關(guān)。

檢測(cè)分割 編輯本段

在圖像處理過程中,有時(shí)會(huì)需要對(duì)圖像進(jìn)行分割來提取有價(jià)值的用于后繼處理的部分,例如

篩選特征點(diǎn);

分割一或多幅圖片中含有特定目標(biāo)的部分。

高級(jí)處理 編輯本段

到了這一步,數(shù)據(jù)往往具有很小的數(shù)量,例如圖像中經(jīng)先前處理被認(rèn)為含有目標(biāo)物體的部分。這時(shí)的處理包括:

驗(yàn)證得到的數(shù)據(jù)是否符合前提要求;

估測(cè)特定系數(shù),比如目標(biāo)的姿態(tài),體積;

對(duì)目標(biāo)進(jìn)行分類。

高級(jí)處理有理解圖像內(nèi)容的含義,是計(jì)算機(jī)視覺中的高階處理,主要是在圖像分割的基礎(chǔ)上再經(jīng)行對(duì)分割出的圖像塊進(jìn)行理解,例如進(jìn)行識(shí)別等操作。

常見問題 編輯本段

幾乎在每個(gè)計(jì)算機(jī)視覺技術(shù)的具體應(yīng)用都要解決一系列相同的問題,這些經(jīng)典的問題包括以下幾點(diǎn)。

識(shí)別 編輯本段

一個(gè)計(jì)算機(jī)視覺,圖像處理和機(jī)器視覺所共有的經(jīng)典問題便是判定一組圖像數(shù)據(jù)中是否包含某個(gè)特定的物體,圖像特征或運(yùn)動(dòng)狀態(tài)。這一問題通??梢酝ㄟ^機(jī)器自動(dòng)解決,但是到目前為止,還沒有某個(gè)單一的方法能夠廣泛的對(duì)各種情況進(jìn)行判定:在任意環(huán)境中識(shí)別任意物體。現(xiàn)有技術(shù)能夠也只能夠很好地解決特定目標(biāo)的識(shí)別,比如簡(jiǎn)單幾何圖形識(shí)別,人臉識(shí)別,印刷或手寫文件識(shí)別或者車輛識(shí)別。而且這些識(shí)別需要在特定的環(huán)境中,具有指定的光照,背景和目標(biāo)姿態(tài)要求。

廣義的識(shí)別在不同的場(chǎng)合又演化成了幾個(gè)略有差異的概念:

識(shí)別(狹義的):對(duì)一個(gè)或多個(gè)經(jīng)過預(yù)先定義或?qū)W習(xí)的物體或物類進(jìn)行辨識(shí),通常在辨識(shí)過程中還要提供他們的二維位置或三維姿態(tài)。

鑒別:識(shí)別辨認(rèn)單一物體本身。例如:某一人臉的識(shí)別,某一指紋的識(shí)別。

監(jiān)測(cè):從圖像中發(fā)現(xiàn)特定的情況內(nèi)容。例如:醫(yī)學(xué)中對(duì)細(xì)胞或組織不正常技能的發(fā)現(xiàn),交通監(jiān)視儀器對(duì)過往車輛的發(fā)現(xiàn)。監(jiān)測(cè)往往是通過簡(jiǎn)單的圖象處理發(fā)現(xiàn)圖像中的特殊區(qū)域,為后繼更復(fù)雜的操作提供起點(diǎn)。

識(shí)別的幾個(gè)具體應(yīng)用方向:

基于內(nèi)容的圖像提?。涸诰薮蟮膱D像集合中尋找包含指定內(nèi)容的所有圖片。被指定的內(nèi)容可以是多種形式,比如一個(gè)紅色的大致是圓形的圖案,或者一輛自行車。在這里對(duì)后一種內(nèi)容的尋找顯然要比前一種更復(fù)雜,因?yàn)榍耙环N描述的是一個(gè)低級(jí)直觀的視覺特征,而后者則涉及一個(gè)抽象概念(也可以說是高級(jí)的視覺特征),即‘自行車’,顯然的一點(diǎn)就是自行車的外觀并不是固定的。

姿態(tài)評(píng)估:對(duì)某一物體相對(duì)于攝像機(jī)的位置或者方向的評(píng)估。例如:對(duì)機(jī)器臂姿態(tài)和位置的評(píng)估。

光學(xué)字符識(shí)別對(duì)圖像中的印刷或手寫文字進(jìn)行識(shí)別鑒別,通常的輸出是將之轉(zhuǎn)化成易于編輯的文檔形式。

運(yùn)動(dòng) 編輯本段

基于序列圖像的對(duì)物體運(yùn)動(dòng)的監(jiān)測(cè)包含多種類型,諸如:

自體運(yùn)動(dòng):監(jiān)測(cè)攝像機(jī)的三維剛性運(yùn)動(dòng)。

圖像跟蹤:跟蹤運(yùn)動(dòng)的物體。

場(chǎng)景重建 編輯本段

給定一個(gè)場(chǎng)景的二或多幅圖像或者一段錄像,場(chǎng)景重建尋求為該場(chǎng)景建立一個(gè)計(jì)算機(jī)模型/三維模型。最簡(jiǎn)單的情況便是生成一組三維空間中的點(diǎn)。更復(fù)雜的情況下會(huì)建立起完整的三維表面模型。

圖像恢復(fù) 編輯本段

圖像恢復(fù)的目標(biāo)在于移除圖像中的噪聲,例如儀器噪聲,模糊等。

附件列表


0

詞條內(nèi)容僅供參考,如果您需要解決具體問題
(尤其在法律、醫(yī)學(xué)等領(lǐng)域),建議您咨詢相關(guān)領(lǐng)域?qū)I(yè)人士。

如果您認(rèn)為本詞條還有待完善,請(qǐng) 編輯

上一篇 機(jī)器學(xué)習(xí)    下一篇 WTT澳門冠軍賽

同義詞

暫無同義詞
精品国精品国产久自在,亚洲色欧在线影院,国产av日产亚洲,中文日韩欧免费精品视频 www.sucaiwu.net