|
公司基本資料信息
|
物體識別
物體識別是計算機視覺領域中的一項基礎研究,它的任務是識別出圖像中有什么物體,并報告出這個物體在圖像表示的場景中的位置和方向。目前物體識別方法可以歸為兩類:基于模型的或者基于上下文識別的方法,二維物體識別或者三維物體識別方法。對于物體識別方法的評價標準,Grimson 總結出了大多數研究者主要認可的 4 個標準:健壯性(robustness)、正確性(correctness)、效率(efficiency)和范圍(scope)。
物體識別
此時的主流方法是只從圖像本身考慮,而不去管物體原來的三維形狀。這類方法統一叫做appearance based techniques。所謂appearance, 從模式識別的角度去描述的話,就是圖像特征(feature),即對圖像的一種抽象描述。有了圖像特征,就可以在這個特征空間內做匹配,或者分類。然 而這個方法還是存在很多問題,首先它需要我們對所有的圖片進行對齊,像人臉圖像,就要求每一幅圖中五官基本在固定的位置。但是很多應用場景下,目標并不是 像人臉那么規整,很難去做統一對齊,而且這種基于全局特征和簡單歐式距離的檢索方法,對復雜背景,遮擋,和幾何變化等并不適用。
物體識別的步驟
圖片的預處理
預處理幾乎是所有計算機視覺算法的一步,其動機是盡可能在不改變圖像 承載的本質信息的前提下,使得每張圖像的表觀特性(如顏色分布,整體明暗, 尺寸大小等)盡可能的一致,主要完成模式的采集、模數轉換、濾波、消除模糊、減少噪聲、糾正幾何失真等操作。
預處理經常與具體的采樣設備和所處理的問題有關。例如,從圖象中將汽車車牌的號碼識別出來,就需要先將車牌從圖像中找出來,再對車牌進行劃分,將每個數字分別劃分開。做到這一步以后,才能對每個數字進行識別。以上工作都應該在預處理階段完成。在物體識別中所用到的典型的預處理方法不外乎直方圖均衡及濾波幾種。像高斯模糊可以使之后的梯度計算更為準確;而直方圖均衡可以克服一定程度的光照影響。值得注意的是,有些特征本身已經帶有預處理的屬性,因此不需要再進行預處理操作。