日韩中文字幕人妻诱惑一级片-精品视频在线观看精品99-粉嫩av一区二区三区不-中文字幕在线观看有码视频

中文
機(jī)器視覺的應(yīng)用及主要瓶頸
2022-04-14
分享
      機(jī)器視覺主要用計(jì)算機(jī)來模擬人的視覺功能,但并不僅僅是人眼的簡(jiǎn)單延伸,更重要的是具有人腦的一部分功能一一從客觀事物的圖像中提取信息,進(jìn)行處理并加以理解,最終用于實(shí)際檢測(cè)、測(cè)量和控制。

  一個(gè)典型的工業(yè)機(jī)器視覺應(yīng)用系統(tǒng),包括數(shù)字圖像處理技術(shù)、機(jī)械工程技術(shù)、控制技術(shù)、視覺光源照明技術(shù)、光學(xué)成像技術(shù)、傳感器技術(shù)、模擬與數(shù)字視頻技術(shù)、計(jì)算機(jī)軟硬件技術(shù)、人機(jī)接口技術(shù)等。

在行業(yè)應(yīng)用方面,主要有制藥、包裝、電子、汽車制造、半導(dǎo)體、紡織、煙草、交通、物流等行業(yè),用機(jī)器視覺技術(shù)取代人工,可以提供生產(chǎn)效率和產(chǎn)品質(zhì)量。例如在物流行業(yè),可以使用機(jī)器視覺技術(shù)進(jìn)行快遞的分揀分類,不會(huì)出現(xiàn)大多快遞公司人工進(jìn)行分揀,減少物品的損壞率,可以提高分揀效率,減少人工勞動(dòng)。

       主要問題和發(fā)展瓶頸

  機(jī)器視覺可以看作是與人工智能和模式識(shí)別密切相關(guān)的一個(gè)子學(xué)科或子領(lǐng)域。限制機(jī)器視覺發(fā)展的瓶頸是多方面的,其中最重要的可以歸結(jié)為三個(gè)方面:計(jì)算能力不足、認(rèn)知理論未明以及精確識(shí)別與模糊特征之間的自相矛盾。

  1.機(jī)器視覺面向的研究對(duì)象主要是圖像和視頻,其特點(diǎn)是數(shù)據(jù)量龐大、冗余信息多、特征空間維度高,同時(shí)考慮到真正的機(jī)器視覺面對(duì)的對(duì)象和問題的多樣性,單一的簡(jiǎn)單特征提取算法(如顏色、空間朝向與頻率、邊界形狀等等)難以滿足算法對(duì)普適性的要求,因此在設(shè)計(jì)普適性的特征提取算法時(shí)對(duì)計(jì)算能力和存儲(chǔ)速度的要求是十分巨大的,這就造成了開發(fā)成本的大幅度提高。

  2. 如何讓機(jī)器認(rèn)知這個(gè)世界?這一問題目前沒有成熟的答案,早期的人工智能理論發(fā)展經(jīng)歷了符號(hào)主義學(xué)派、行為主義學(xué)派、連接主義學(xué)派等一系列的發(fā)展但都沒有找到令人滿意的答案,目前較新的思想認(rèn)為應(yīng)該從分析、了解和模擬人類大腦的信息處理功能去構(gòu)建智能機(jī)器視覺系統(tǒng),但神經(jīng)科學(xué)的發(fā)展目前只能做到了解和模擬大腦的一個(gè)局部,而不是整體(當(dāng)然計(jì)算能力限制也是原因之一)。事實(shí)上,我們對(duì)人是如何對(duì)一個(gè)目標(biāo)或場(chǎng)景進(jìn)行認(rèn)知的這一問題仍停留在定性描述而非定量描述上。

  3. 機(jī)器視覺系統(tǒng)經(jīng)常被人詬病的問題之一就是準(zhǔn)確性。以十年前如火如荼的人臉識(shí)別算法為例,盡管一系列看似優(yōu)秀的算法不斷問世,但目前為止在非指定大規(guī)模樣本庫下進(jìn)行人臉識(shí)別的準(zhǔn)確率仍然無法滿足實(shí)際應(yīng)用的需求,因此無法取代指紋或虹膜等近距接觸式生物特征識(shí)別方法。這一問題的出現(xiàn)并非偶然。因?yàn)槟繕?biāo)越精細(xì),越復(fù)雜,信息越大,則其模糊性和不確定性也越強(qiáng)。人類之所以能夠較好的對(duì)人臉進(jìn)行識(shí)別,其實(shí)也是以犧牲一定的準(zhǔn)確性為代價(jià)的。而機(jī)器視覺在做的事情一方面想要借鑒人腦或人眼系統(tǒng)的靈感去處理復(fù)雜而龐大的信息流,另一方面又想摒除人腦在模式識(shí)別方面存在的精確性不足的缺陷。

         關(guān)于視覺測(cè)量研究:

  (1)機(jī)器視覺測(cè)量的可靠性。相比與其他測(cè)量手段,視覺的最大優(yōu)點(diǎn)就是可以快速獲得三維信息,一張或幾張照片就可以重建出被測(cè)物體的三維特征,進(jìn)而實(shí)現(xiàn)測(cè)量。但正如大家所說,只要測(cè)量條件、環(huán)境、被測(cè)物表面特性等改變,有時(shí)甚至?xí)r稍加改變,結(jié)果則大不一樣,測(cè)量重復(fù)性和精度更無從談起。這也是目前機(jī)器視覺測(cè)量尺寸、位姿等參數(shù)時(shí)比較突出的問題,特別是在一些強(qiáng)光干擾、溫度場(chǎng)變化、光照條件變化的應(yīng)用場(chǎng)合這個(gè)問題尤為突出。因此,視覺測(cè)量的環(huán)境適應(yīng)性問題解決難度很大,無法找到普適性的方法,只能針對(duì)具體問題,研究相應(yīng)光照、特征提取、匹配、重建、標(biāo)定等具體方法。

  (2)測(cè)量精度問題。精度是測(cè)量系統(tǒng)的重要指標(biāo)。視覺測(cè)量精度依賴于相機(jī)分辨率、視場(chǎng)大小、圖像處理算法等等。CCD和CMOS的制造工藝已取得長足進(jìn)步,目前6000*4000pixel的分辨率已經(jīng)成為穩(wěn)定商品。而采用壓電驅(qū)動(dòng)芯片做微米級(jí)移動(dòng)進(jìn)行像素細(xì)分的方法和設(shè)備已經(jīng)商品化,號(hào)稱分辨率可近20000*14000pixel。

  提升三維技術(shù)

  在現(xiàn)實(shí)生活中,我們?cè)絹碓叫枰嗟娜S模型來實(shí)現(xiàn)對(duì)物體或環(huán)境的全面掌握。獲得三維模型有兩種基本方式,一種是利用激光掃描儀,一種是拍攝照片。但激光掃描儀的成本高,也有可能會(huì)對(duì)樣本帶來一些損害。第二種方式的成本小,而且在精度上也跟激光掃描儀相差無幾,因此成為了現(xiàn)在研究的一個(gè)熱點(diǎn)。

  我們知道,一般的圖像上是沒有長度、距離等深度信息的,而三維模型則能更加全面、精確地記錄環(huán)境,可以直觀呈現(xiàn)物體的位置、距離、姿態(tài)等。比如中國古代建筑全自動(dòng)三維重建系統(tǒng),能夠?qū)崿F(xiàn)全自動(dòng)三維建模,即從底層圖像處理到生成最終的三維模型,全部自動(dòng)實(shí)現(xiàn),無需人工交互。它對(duì)圖像的拍攝方式也無特殊約束和限制,只需手持自由拍攝即可。在精度上,也與激光掃描精度相當(dāng),精度小于3cm/100米,通過配備更高像素?cái)?shù)量的相機(jī)和長焦鏡頭還可以實(shí)現(xiàn)毫米級(jí)重建。

  此外,在實(shí)時(shí)定位與在線三維重建方面,機(jī)器視覺也具有極大的應(yīng)用潛力。將手機(jī)上攝像頭讀取的視頻作為輸入,通過初始化、特征點(diǎn)提取、動(dòng)態(tài)模板特征點(diǎn)匹配、幾何變化計(jì)算階段后得到視頻每一幀中感興趣區(qū)域的位置。

  目前,我國基于機(jī)器視覺的三維重建技術(shù)在國際上可以說處于領(lǐng)先地位,應(yīng)用也比較廣泛。除了上述之外,還能用在一些不太適合人工作業(yè)的環(huán)境監(jiān)測(cè)方面,像對(duì)露天煤礦的監(jiān)測(cè),就是通過無人機(jī)對(duì)煤礦進(jìn)行全方位拍攝,生成三維模型來實(shí)時(shí)監(jiān)測(cè)礦山的變化。此外,也能應(yīng)用于城市規(guī)劃、數(shù)字媒體、三維試衣、牙模制造等多方面。

  未來發(fā)展趨勢(shì)

  由于機(jī)器視覺是自動(dòng)化的一部分,沒有自動(dòng)化就不會(huì)有機(jī)器視覺,機(jī)器視覺軟硬件產(chǎn)品正逐漸成為協(xié)作生產(chǎn)制造過程中不同階段的核心系統(tǒng),無論是用戶還是硬件供應(yīng)商都將機(jī)器視覺產(chǎn)品作為生產(chǎn)線上信息收集的工具,這就要求機(jī)器視覺產(chǎn)品大量采用標(biāo)準(zhǔn)化技術(shù),直觀地說就是要隨著自動(dòng)化的開放而逐漸開放,可以根據(jù)用戶的需求進(jìn)行二次開發(fā)。

  當(dāng)今,自動(dòng)化企業(yè)正在倡導(dǎo)軟硬一體化解決方案,機(jī)器視覺的廠商在未來十年內(nèi)也應(yīng)該不單純是只提供產(chǎn)品的供應(yīng)商,而是逐漸向一體化解決方案的系統(tǒng)集成商邁進(jìn)。隨著中國加工制造業(yè)的發(fā)展,對(duì)于機(jī)器視覺的需求也逐漸增多。隨著機(jī)器視覺產(chǎn)品的增多,技術(shù)的提高,國內(nèi)機(jī)器視覺的應(yīng)用狀況將由初期的低端轉(zhuǎn)向高端。由于機(jī)器視覺的介入,自動(dòng)化將朝著更智能、更快速的方向發(fā)展。