什麽是計算機視覺?

2020-02-11

AI人工(gōng)智能知(zhī)識理解篇—計算機視覺技術

data-ai.jpg


  1.計算機視覺技術(ComputerVision),什麽是計算機視覺?

  “人的大(dà)腦皮層的活動,大(dà)約70%是在處理視覺相關信息。視覺就相當于人腦的大(dà)門,其它如聽(tīng)覺、觸覺、味覺那都是帶寬較窄的通道。視覺相當于八車(chē)道的高速,其它感覺是兩旁的人行道。如果不能處理視覺信息的話(huà),整個人工(gōng)智能系統是個空架子,隻能做符号推理,比如下(xià)棋、定理證明,沒法進入現實世界。計算機視覺之于人工(gōng)智能,它相當于說芝麻開(kāi)門。大(dà)門就在這裏面,這個門打不開(kāi),就沒法研究真實世界的人工(gōng)智能。”——朱松純,加州大(dà)學洛杉矶分(fēn)校UCLA統計學和計算機科學教授根據科普中(zhōng)國撰寫的對計算機視覺的定義,這是一(yī)門研究如何讓機器“看”的科學,更進一(yī)步的說,是指用計算機代替人眼對目标進行識别、跟蹤和測量的機器視覺,并進一(yī)步做圖形處理,使計算機處理成爲更适合人眼觀察或傳送給儀器檢測的圖像。

  2.計算機視覺VS機器視覺

  計算機視覺更關注圖像信号本身以及圖像相關交叉領域(地圖、醫療影像)的研究;機器視覺則偏重計算機視覺技術工(gōng)程化,更關注廣義上的圖像信号(激光和攝像頭)和自動化控制(生(shēng)産線)方面的應用。

  3.計算機視覺識别技術的分(fēn)類

  物(wù)體(tǐ)識别分(fēn)爲“1VSN”對不同物(wù)體(tǐ)進行歸類,以及“1VS1”對同類型的物(wù)體(tǐ)進行區分(fēn)和鑒别;物(wù)體(tǐ)屬性識别,結合地圖模型讓物(wù)體(tǐ)在視覺的三維空間裏得到記憶的重建,進而進行場景的分(fēn)析和判斷;物(wù)體(tǐ)行爲識别分(fēn)爲3個進階的步驟,移動識别判斷物(wù)體(tǐ)是否做了位移,動作識别判斷物(wù)體(tǐ)做的是什麽動作,行爲識别是結合視覺主體(tǐ)和場景的交互做出行爲的分(fēn)析和判斷。

  4.計算機視覺的識别流程

  訓練模型:樣本數據包括正樣本(包含待檢目标的樣本)和負樣本(不包含目标的樣本),視覺系統利用算法對原始樣本進行特征的選擇和提取訓練出分(fēn)類器(模型);此外(wài)因爲樣本數據成千上萬、提取出來的特征更是翻番,所以一(yī)般爲了縮短訓練的過程,會人爲加入知(zhī)識庫(提前告訴計算機一(yī)些規則),或者引入限制條件來縮小(xiǎo)搜索空間。

  識别圖像:會先對圖像進行信号變換、降噪等預處理,再來利用分(fēn)類器對輸入圖像進行目标檢測。一(yī)般檢測過程爲用一(yī)個掃描子窗口在待檢測的圖像中(zhōng)不斷的移位滑動,子窗口每到一(yī)個位置就會計算出該區域的特征,然後用訓練好的分(fēn)類器對該特征進行篩選,判斷該區域是否爲目标。

  5.計算機視覺技術模式圖和對應企業圖

  目前世界上圖像識别最大(dà)的數據庫,是斯坦福大(dà)學人工(gōng)智能實驗室提供的ImageNet,針對諸如醫療等細分(fēn)領域也需要收集相應的訓練數據;Google、Microsoft此類科技巨頭會面向市場提供開(kāi)源算法框架,爲初創視覺識别公司提供初級算法。

責任編輯:中(zhōng)山網站建設
 【網訊網絡】國家高新技術企業》十一(yī)年專注軟件開(kāi)發,網站建設,網頁設計,APP開(kāi)發,小(xiǎo)程序,微信公衆号開(kāi)發,定制各類企業管理軟件(OA、CRM、ERP、OMS訂單管理系統、WMS進銷存管理軟件等)!服務熱線:0760-88610046、13924923903,http://www.wansion.net

您的項目需求咨詢熱線:0760-88610046(國家高新技術企業)

*請認真填寫需求,我(wǒ)們會在24小(xiǎo)時内與您取得聯系。