動物面部識別技術如何工作?能用來做什么?
以往在這方面,微芯片是最受歡迎的動物識別方法。然而,植入芯片需要進行侵入性手術。如果沒有專門的設備,它們就無法讀取,而且小偷可以提取微芯片。另一種方法是DNA分析,它是精確的,但也非常昂貴和耗時。
由計算機視覺解決方案支持的動物面部識別(有時不僅僅限于面部)可以作為上述方法的一個可行的替代方案。盡管它有其缺點,但該技術可以在特定情況下顯示出高水平的準確性。那么,動物面部識別是如何操作的呢?阻礙這項技術進步的挑戰會在哪里?
一、動物面部識別是如何工作的?
一般情況下,動物面部識別解決方案主要有三個步驟:
圖像捕捉:用高分辨率相機拍攝動物的照片。有些算法只對預定義的姿態起作用,所以必須選擇符合這些條件的圖像。
特征提取:評估動物的生物特征數據的適用性,并在需要時進行預處理。然后該算法提取出識別所需的特征集。
匹配:將提取的特征進行數學表示,并與其他圖像進行匹配。例如,如果我們正在丟失的寵物數據庫中尋找一只狗,我們將狗的獨特特征與該數據庫中所有的動物進行匹配。
幾種方法可以執行匹配。一種方法是使用KNN和DBSCAN等算法進行聚類,得到一組與我們的目標圖像高度接近的圖像,用戶可以手動選擇最合適的圖像。此外,還可以采用概率方法,將最終結果表示為置信水平。
據介紹,能夠準確識別動物的技術可以幫助主人與走失的動物團聚,識別特定的動物,幫助農民監控牲畜,幫助研究人員研究野生動物。
二、實施動物面部識別技術的挑戰
動物的面部識別技術遠遠落后于目前相當先進的人臉識別技術。研究人員大約四年前開始對動物面部識別進行實驗,但通用技術的準確性仍然相當低。另一方面,具有特定目的的解決方案,例如識別一種特定的動物,可以是準確的。
想要實現動物面部識別解決方案的公司需要考慮三個主要挑戰:
1、確定最優特征集
科學家們已經指定了一種特征向量,可以用于獨特的人臉識別。然而,同樣的方法并不適用于動物,因為我們不知道我們需要使用哪些功能以及如何解釋它們。例如,在與人打交道時,科學家可以使用變分自動編碼器(VAE)架構從人臉中提取特征。在這種方法中,一個人的照片被壓縮到包含所需特征的向量,如膚色和面部表情。
說到動物面部識別,目前還沒有可靠的特征向量。解決一個可靠的特征向量的挑戰將大大推進該領域的研究。
在這方面的一個開源例子是DogFaceNet,它是一個基于深度學習的狗識別實現。它使用狗的眼睛和鼻子作為特征集。如果整體目標是區分狗的品種,這個解決方案工作得相當好,但當涉及到區分動物個體時,它的表現相當差。
2、取決于一個動物的姿勢
另一個例子是使用局部二值模式直方圖(LBPH)算法,它將圖像轉換成像素,通過比較不同圖像的像素值進行運算。這種方法取決于動物的姿態,這使得它對姿態變化很敏感。
對于人類來說,很容易擺出一個特定的姿勢并坐著不動。然而,當我們試圖讓貓或狗以特定的姿勢保持不動時,事情就變得更加復雜了。
3、提供全面的訓練數據集
為了使訓練有效,數據必須是多樣化的,并覆蓋算法預期執行的所有任務。例如,如果該算法應該識別不同的狗品種,那么數據集應該充分覆蓋從不同角度捕獲的所有的品種,并進行適當的標記。這里有幾個可能出錯的地方。例如,有人可能會提交混合品種的圖片,有人可能會給他們的圖片貼上錯誤的標簽,并指定錯誤的品種名稱。為了避免此類問題,專家必須逐一審查數據集中的所有照片,以驗證圖像的合法性和標簽的準確性。
動物面部識別的發展并不會像人臉面部那樣迅速和精準,因為面對不同動物的特征和習慣等,也都無法將數據進行全面的采集和操作,對月野生動物還沒有更具體的解決方案,在動物的臉部識別上,還有很長一段路要走。