基于多個(gè)特征分塊貝葉斯分類器融合策略的人臉識(shí)別方法
摘要:提出一種基于奇異值分解和貝葉斯決策的人臉特征提取與識(shí)別算法。通過(guò)對(duì)人臉圖像樣本進(jìn)行幾何歸一化和灰度均衡化后,結(jié)合分塊與加權(quán),運(yùn)用奇異值分解,分別獲得特征臉和標(biāo)準(zhǔn)臉,然后采用多個(gè)基于特征分塊的貝葉斯分類器(FBBC)的融合策略進(jìn)行分類識(shí)別。實(shí)驗(yàn)驗(yàn)證了該方法的有效性,具有良好的精煉和實(shí)時(shí)性品質(zhì)指標(biāo)。
本文引用地址:http://m.ptau.cn/article/88958.htm關(guān)鍵詞:奇異值分解;貝葉斯決策;人臉特征;分類;圖像
引言
人臉識(shí)別是指利用計(jì)算機(jī)對(duì)人臉圖像進(jìn)行分析,從中提取有效的識(shí)別信息,用來(lái)鑒別身份的一種技術(shù),具有直接、友好、方便等優(yōu)點(diǎn)。基于奇異值特征的人臉識(shí)別方法是由 Hong[1][4]首先提出來(lái)的。該方法將人臉特征分為視覺特征、統(tǒng)計(jì)特征、變換系數(shù)特征以及代數(shù)特征四類,代數(shù)特征反映了圖像的本質(zhì)屬性。因?yàn)閳D像本身的灰度分布描述了圖像的內(nèi)在信息,故可以將圖像作為矩陣看待,進(jìn)行各種代數(shù)和矩陣變換后提取的代數(shù)特征是人臉的表征。
由于人臉圖像往往受到表情、角度、光照、背景等細(xì)微變化的影響,于是,能否精確而有效地提取人臉特征成為人臉識(shí)別技術(shù)的關(guān)鍵所在。奇異值分解(Singular Value Decomposition, SVD)是一種有效的代數(shù)特征提取方法。奇異值特征被認(rèn)為是人臉圖像的本質(zhì)特征,并且具有轉(zhuǎn)置不變性、旋轉(zhuǎn)不變性、位移不變性、鏡像不變性等諸多重要的性質(zhì),因此采用奇異值來(lái)描述人臉特征是一種有效的方法。
由于整體圖像的奇異值向量反映的是圖像整體的統(tǒng)計(jì)特征,對(duì)細(xì)節(jié)的描述還不夠深入,本文模擬人類識(shí)別人臉的模式,在分塊和加權(quán)的基礎(chǔ)上,重建突出待識(shí)別人臉的骨骼特征描述的矩陣,近似于人類在識(shí)別人臉時(shí)自動(dòng)剔除同一人臉的變化部位的差異能力。
人臉識(shí)別在本質(zhì)上是要區(qū)分兩幅人臉圖像表觀上的差別是類內(nèi)變化(同一人的不同圖像)還是類間變化(不同人的不同圖像)。因此,如何對(duì)類內(nèi)變化以及類間變化精確的建模和分類就成為人臉識(shí)別研究領(lǐng)域的重要內(nèi)容之一。在眾多的建模、分類方法中,統(tǒng)計(jì)模型是一種主流方法,其中Moghaddam[8]提出的貝葉斯分類器得到了廣泛的認(rèn)可。
奇異值分解
對(duì)于任何一個(gè)矩陣A∈Rm×n,利用奇異值分解將其轉(zhuǎn)化為對(duì)角矩陣。
定理(SVD)
設(shè)A∈Rm×n(不失一般性,設(shè)m≥n),且rank(A)=k,則存在兩個(gè)酉矩陣(所謂酉矩陣就是其逆矩陣等于共軛轉(zhuǎn)置矩陣)Um×m和Un×n及廣義對(duì)角陣Dm×m使下式成立:
其中,U的列向量是AAT的特征向量,V的列向量是ATA的特征向量,式中T表示轉(zhuǎn)置。
(i=1,2,…,k,…,n)稱為矩陣A的奇異值,是AAT同時(shí)也是ATA的k個(gè)非零特征值,lk+1=lk+2=...=lm=0為AAT的m-k個(gè)零特征值,而lk+1=lk+2=...=ln=0為ATA的ri-k個(gè)零特征值。uivi(i=1,2,…,k)分別是AAT和ATA的非零特征值li對(duì)應(yīng)的特征向量,ui(i=k+1,…,m)是AAT對(duì)應(yīng)于li=0的特征向量,vi(i=k+1,…,n)是ATA對(duì)應(yīng)于li=0的特征向量。將式A=UDVT寫成乘積的形式為:,如果矩陣A代表一幅人臉圖像,則式
表示對(duì)該人臉圖像進(jìn)行了正交分解,將矩陣中主對(duì)角線上的奇異值元素si連同中Dm×n剩余的(ri-k)個(gè)0組合構(gòu)成一個(gè)n維列向量Xn×1:Xn×1=Dn×n e=(s1,...sk,0,...,0)T其中Dn×n為矩陣D中的第1個(gè)n階子式,列向量(e=1,1,...,1)Tn×n,則稱Xn×1為矩陣A的奇異值特征向量。
由于任何實(shí)矩陣A對(duì)應(yīng)唯一的奇異值對(duì)角陣,因此,其對(duì)應(yīng)的奇異值特征向量也是唯一的,即一幅人臉圖像對(duì)應(yīng)于唯一的奇異值特征向量。
人臉特征提取方法
為了解決小樣本甚至單樣本識(shí)別問題,國(guó)內(nèi)外研究者將奇異值方法與其它方法相結(jié)合,提出了組合人臉特征提取方法,具有代表性的有Hong[1]等人提出的基于奇異值特征和統(tǒng)計(jì)模型的人臉識(shí)別方法, Wang[2]提出的基于奇異值分解和神經(jīng)網(wǎng)絡(luò)的人臉鑒別方法等,這些方法使得在人臉庫(kù)上的小樣本識(shí)別率達(dá)到了90%以上。但是Tian[3]等人發(fā)現(xiàn),直接對(duì)整幅人臉圖像進(jìn)行奇異值分解,并沒有考慮人臉的局部和細(xì)節(jié)特征,而且提取的奇異值特征中包含了大量冗余信息。
本文提出的人臉特征提取方法實(shí)現(xiàn)的流程如下:(1)從人臉數(shù)據(jù)庫(kù)選擇人臉作為識(shí)別訓(xùn)練集→(2)將被選入訓(xùn)練集的人臉圖像幾何歸一→(3)將被選入訓(xùn)練集的人臉圖像灰度歸一→(4)將預(yù)處理過(guò)的人臉圖像分為32*32的九個(gè)子塊→(5)將每一幅圖像變?yōu)橐粋€(gè)列向量(先分別將每一個(gè)子塊所有向量排成一列,再將九個(gè)子塊按順序排成一列);然后以子塊為單位進(jìn)行(6)計(jì)算全部人臉圖像的均值→(7)計(jì)算每一類人臉圖像的平均臉同時(shí)將人臉圖像列向量與類內(nèi)平均臉做差。
樣本圖像幾何歸一化和灰度均衡化處理
本文采用雙線性插值方法對(duì)圖像進(jìn)行尺度歸一化。
設(shè)變換后圖像內(nèi)的一點(diǎn)在原圖中的對(duì)應(yīng)位置為(u,v),(u,v)周圍的四個(gè)點(diǎn)(i,j),(i,j+1),(i+1,j),(i+1,j+1)的值已知,(u,v)與點(diǎn)(i,j)的橫坐標(biāo)距離為a,縱坐標(biāo)距離為b,則變換后圖像內(nèi)對(duì)應(yīng)于原圖像內(nèi)點(diǎn)(u,v)的點(diǎn)的灰度值為g=f(u,v)
首先我們對(duì)上端進(jìn)行線性插值可得f(u,j)=f(i,j)+a[f(i+1,j)-f(i,j)] (2)
類似,對(duì)地端兩個(gè)頂點(diǎn)的線性插值有f(u,j+1)=f(i,j+1)+a[f(i+1,j)-f(i,j)] (3)
最后,我們做垂直方向的線性插值,有f(u,v)=f(u,j)+b[f(u,j+1)-f(u,j)] (4)
具體結(jié)果如圖1所示。
圖1人臉圖像幾何歸一化處理結(jié)果
幾何歸一后的圖像再經(jīng)灰度均衡化處理,人臉圖像的直方圖均衡化是實(shí)現(xiàn)圖像增強(qiáng)一種有效途徑。
獲取特征臉的算法
根據(jù)圖1中的人臉圖像的分塊處理,按照從左到右,從上到下的順序?qū)⒁粡埲四樕夏樂譃榫艂€(gè)部分,依次標(biāo)注為1、2、3、4、5、6、7、8、9。研究發(fā)現(xiàn)人臉的不同特征在識(shí)別過(guò)程中所起的作用是不相同的,基于面部骨骼特征、眼睛的分布、鼻子的形狀等結(jié)構(gòu)特征,往往是鑒別人臉的主要依據(jù)。將整個(gè)人臉分成九小部分時(shí),原來(lái)需要計(jì)算962×962維矩陣的特征值與特征向量,現(xiàn)在只需要計(jì)算9個(gè)322×322維的矩陣的特征值與特征向量,減少了計(jì)算量和計(jì)算時(shí)間。具體實(shí)現(xiàn)方法描述如下。
設(shè)本實(shí)驗(yàn)所用人臉可以用矩陣描述為:
(5)
將矩陣分為3×3的九個(gè)子塊,每個(gè)子塊分別為32×32的矩陣A1…A9,過(guò)程如下:
(6)
(7)
將每一幅人臉圖像所形成的矩陣按此方法進(jìn)行劃分。將A1…A9九個(gè)二維矩陣分別降維為322×1的列向量。
以將人臉劃分后的第一塊為例,求訓(xùn)練集中所有這一子塊的平均值, 其中M為訓(xùn)練集中人臉圖像總數(shù),1表示第一子塊:;再對(duì)每一類樣本中的所有第一子塊求平均,
;對(duì)每一子塊進(jìn)行樣本規(guī)范化,
;并求協(xié)方差矩陣:
從矩陣Q1的特征值和特征向量中,取 m 個(gè)較大特征值對(duì)應(yīng)的特征向量,構(gòu)成第一子塊的特征臉空間W1,即W1=[w11,w12,…, w1m]T。再對(duì)訓(xùn)練樣本進(jìn)行規(guī)范化處理,投影到特征臉空間,獲得投影特征為:
對(duì)任一測(cè)試樣本的第一子塊X1的規(guī)范化,即然后得到投影特征y1,即。
用同上述相同方法逐一對(duì)其它八個(gè)子塊進(jìn)行同樣處理。得到y(tǒng)2 ,y3 ,…,y9。再根據(jù)劃分的9個(gè)子塊的重要性不同,在識(shí)別時(shí)給它們分別賦予不同的權(quán)值。
將人臉分成的A1…A9這九個(gè)部分分別給以a1,… a9這九個(gè)權(quán)值,設(shè)b1,… b9是A1…A9這九個(gè)塊的權(quán)重,則有:,其中,根據(jù)人類識(shí)別人臉的思維特點(diǎn),可以把變化較大的嘴部的b8塊的權(quán)重定義為0,利用人臉骨骼特征明顯、結(jié)構(gòu)穩(wěn)定的小塊獲得人臉圖像的訓(xùn)練集并計(jì)算特征臉,節(jié)省訓(xùn)練時(shí)間;也可以在識(shí)別階段通過(guò)權(quán)值分配剔除變動(dòng)較大的部位(如圖2)。
圖2人臉圖像分塊處理結(jié)果
基于特征分塊的貝葉斯分類器設(shè)計(jì)
每個(gè)基于特征分塊的貝葉斯分類器,利用了所對(duì)應(yīng)的圖像塊包含的判別信息,為得到性能更好的分類器,需要將這些分類器融合給出最終的判別結(jié)果。每個(gè)貝葉斯分類器實(shí)際上是一個(gè)子分類器??梢杂卸喾N辦法實(shí)現(xiàn)分類器融合,比如加權(quán)求和、相乘等。本文采取加權(quán)求和的方法:

其中S(Ii,Ij)表示兩幅圖像Ii與Ij的相似度,L是貝葉斯分類器(FBBC)的總數(shù)(這里是9),是Ii與Ij的第b個(gè)特征塊之間的差值。是由第b個(gè)貝葉斯分類器計(jì)算出的類條件概率密度。wb是第b個(gè)貝葉斯分類器對(duì)應(yīng)的權(quán)值。
不同的特征塊對(duì)應(yīng)的貝葉斯分類器對(duì)最終判別結(jié)果貢獻(xiàn)是不相同的,本文采取的是基于子分類器分類準(zhǔn)確率分配權(quán)值的方法:將各子分類器重新放回其訓(xùn)練集,計(jì)算其在訓(xùn)練集上的識(shí)別率,利用這些識(shí)別率,采用如下式計(jì)算第b個(gè)子分類器的權(quán)值:
(9)
實(shí)驗(yàn)結(jié)果及分析
下面是利用在Yale人臉庫(kù)中的人臉圖像,分以下4種分塊加權(quán)的情況進(jìn)行實(shí)驗(yàn):
1、b1=b3=4; b5=2; b8=2; b2=b4=b6=b7=b9=1
2、b1=b3=4; b5=3; b8=2; b2=b4=b6=b7=b9=1
3、b1=b3=4; b5=2; b8=0; b2=b4=b6=b7=b9=1
4、b1=b3=4; b5=2; b8=0; b2=b4=b6=b7=b9=1
表中的實(shí)驗(yàn)結(jié)果表明,基于面部骨骼特征、眼睛的分布、鼻子的形狀等結(jié)構(gòu)特征,往往是鑒別人臉的主要依據(jù),被賦以50%的權(quán)重,識(shí)別效果較好,這與人類識(shí)別人臉時(shí)主要依據(jù)面部骨骼等穩(wěn)定特征,而對(duì)嘴部和皮膚折皺等表情變化部分特征給予弱化或剔除這一特點(diǎn)非常相似。而且對(duì)人臉圖像進(jìn)行分塊,減小了計(jì)算量,在樣本數(shù)量很大、維數(shù)很高的情況下,避免了計(jì)算量的猛增。
表1 第1、2種分塊加權(quán)方法的識(shí)別結(jié)果
表2 第3、4種剔除嘴部分塊加權(quán)方法的識(shí)別結(jié)果
結(jié)論
本文在分析基于人臉圖像分塊與SVD壓縮對(duì)于提取人臉特征的應(yīng)用基礎(chǔ)上,結(jié)合基于特征分塊的貝葉斯分類器的設(shè)計(jì),提出了基于奇異值分解和貝葉斯決策的人臉識(shí)別方法,模擬人類識(shí)別人臉時(shí)剔除同一人臉變化部位的差異能力,在用不同子塊單獨(dú)進(jìn)行人臉識(shí)別之后,根據(jù)識(shí)別效果人工進(jìn)行權(quán)值分配,通過(guò)對(duì)Yale標(biāo)準(zhǔn)人臉圖像庫(kù)的實(shí)驗(yàn)仿真及對(duì)比數(shù)據(jù)結(jié)果表明,本文方法在降維和識(shí)別率方面均取得良好的效果,在正面人臉部位(尤其是嘴部)變化較大時(shí),具有良好的魯棒性。不過(guò),該方法的不足是在人臉角度發(fā)生較大變化和眼部有飾物的情況下,識(shí)別效果將變差,識(shí)別方法有待進(jìn)一步改進(jìn)。
參考文獻(xiàn):
1. Hong Z Q. Algebraic Feature Extraction of Image Recognition. Pattern Recognition, 1991,24(3): 211-219.
2. Xiaogang Wang and Xiaoou Tang, Bayesian Face Recognition Based on Gaussian Mixture Models Pattern Recognition, 2004. ICPR 2004. Proceedings of the 17th International Conference on Aug.2004, pp:142- 145 Vol.4.
3. Tian Y, Tan T N, Wang Y H, Fang Y C. Do Singular Values Contain Adequate Information for Recognition? Pattern Recognition, 2003, 36(3): 649-655.
4. 洪子泉、楊靜宇,基于奇異值特征和統(tǒng)計(jì)模型的人臉識(shí)別算法,計(jì)算機(jī)研究與發(fā)展,1994, 31(3): 60-65.
5. W. Y. Zhao, R. Chellappa, P. J. Phillips, and A. Rosenfeld. Face Recognition: A Literature Survey. ACM Computing Survey, vol. 35, no 4, pp. 399-458, 2003.
6. Richard O.Duba,etc, Pattern Classification, Second Edition, published by John Wiley & Sons,Inc. 2001.
7. R.Chellappa, C.L.Wilson ect. Human and Machine Recognition of Faces: A Survey, Proc.of the IEEE Transactions on Image. 83(5), pp705-740, 1995.5.
8. B.Moghaddam, T.Jebara, A.Pentland, Bayesian Face Recognition, Pattern Recognition Vol.33, pp1771-1782, 2000.
9. 謝永華等,基于分塊小波變換與奇異值閾值壓縮的人臉特征提取與識(shí)別算法,計(jì)算機(jī)應(yīng)用與軟件,2008,25(1):30-32.
評(píng)論