|
公司基本資料信息
|
物體識(shí)別
物體識(shí)別是計(jì)算機(jī)視覺領(lǐng)域中的一項(xiàng)基礎(chǔ)研究,它的任務(wù)是識(shí)別出圖像中有什么物體,并報(bào)告出這個(gè)物體在圖像表示的場景中的位置和方向。目前物體識(shí)別方法可以歸為兩類:基于模型的或者基于上下文識(shí)別的方法,二維物體識(shí)別或者三維物體識(shí)別方法。對于物體識(shí)別方法的評(píng)價(jià)標(biāo)準(zhǔn),Grimson 總結(jié)出了大多數(shù)研究者主要認(rèn)可的 4 個(gè)標(biāo)準(zhǔn):健壯性(robustness)、正確性(correctness)、效率(efficiency)和范圍(scope)。
物體識(shí)別
此時(shí)的主流方法是只從圖像本身考慮,而不去管物體原來的三維形狀。這類方法統(tǒng)一叫做appearance based techniques。所謂appearance, 從模式識(shí)別的角度去描述的話,就是圖像特征(feature),即對圖像的一種抽象描述。有了圖像特征,就可以在這個(gè)特征空間內(nèi)做匹配,或者分類。然 而這個(gè)方法還是存在很多問題,首先它需要我們對所有的圖片進(jìn)行對齊,像人臉圖像,就要求每一幅圖中五官基本在固定的位置。但是很多應(yīng)用場景下,目標(biāo)并不是 像人臉那么規(guī)整,很難去做統(tǒng)一對齊,而且這種基于全局特征和簡單歐式距離的檢索方法,對復(fù)雜背景,遮擋,和幾何變化等并不適用。
物體識(shí)別的步驟
圖片的預(yù)處理
預(yù)處理幾乎是所有計(jì)算機(jī)視覺算法的一步,其動(dòng)機(jī)是盡可能在不改變圖像 承載的本質(zhì)信息的前提下,使得每張圖像的表觀特性(如顏色分布,整體明暗, 尺寸大小等)盡可能的一致,主要完成模式的采集、模數(shù)轉(zhuǎn)換、濾波、消除模糊、減少噪聲、糾正幾何失真等操作。
預(yù)處理經(jīng)常與具體的采樣設(shè)備和所處理的問題有關(guān)。例如,從圖象中將汽車車牌的號(hào)碼識(shí)別出來,就需要先將車牌從圖像中找出來,再對車牌進(jìn)行劃分,將每個(gè)數(shù)字分別劃分開。做到這一步以后,才能對每個(gè)數(shù)字進(jìn)行識(shí)別。以上工作都應(yīng)該在預(yù)處理階段完成。在物體識(shí)別中所用到的典型的預(yù)處理方法不外乎直方圖均衡及濾波幾種。像高斯模糊可以使之后的梯度計(jì)算更為準(zhǔn)確;而直方圖均衡可以克服一定程度的光照影響。值得注意的是,有些特征本身已經(jīng)帶有預(yù)處理的屬性,因此不需要再進(jìn)行預(yù)處理操作。