基于ARM的文本獨立筆跡鑒別系統(tǒng)設計
筆跡,是具有個人特征的書寫文字符號的形象系統(tǒng),與個人書寫習慣有密切聯(lián)系。利用計算機進行個人筆跡鑒別,是模式識別的分支問題,是通過分析比較不同人筆跡的書寫風格來判斷書寫者身份的一種技術方法。文本獨立(Text—independent)是指進行鑒別時,對書寫者書寫的內容沒有特殊要求,具有樣本依存性小、信息采集方便等特點,具有廣泛的應用前景。通過對筆跡分析做出身份判斷,在計算機登錄、電子商務、金融安全、文物監(jiān)測、信息安全等方面具有重要應用。國內外對基于PC平臺的筆跡鑒別系統(tǒng)算法進行了細致研究,師寶山等人解決了紙質筆跡信息的預處理問題,張德賢等人提出了筆跡信息的特征提取算法,劉海等人提出了基于輪廓方向特征提取的筆跡鑒別方法,劉愛真提出了利用希爾伯特-黃變換(HHT)方法對脫機手寫體漢字特征進行提取,楊彩霞提出了基于Gabor變換和最鄰近分類器的筆跡鑒別方法,劉宏等人提出了基于紋理分析優(yōu)化Gabor變換和支持向量機(Support Vector Machines,SVM)的筆跡鑒別方法。這些方法的鑒別性較好,可實現(xiàn)性強,但都局限在PC系統(tǒng)層面,筆跡的采集方式復雜,不能實現(xiàn)實時的筆跡鑒別系統(tǒng)。本文提出了一種基于嵌入式系統(tǒng)的實時筆跡鑒別系統(tǒng),該系統(tǒng)主要針對離線的文本獨立筆跡進行嵌入式鑒別研究,使用ARM終端實時采集筆跡信息,使用Gabor濾波器提取筆跡樣本的紋理特征,使用支持向量機(SVM)訓練和識別筆跡信息的特征。
本文引用地址:http://m.ptau.cn/article/201609/304006.htm1 筆跡鑒別系統(tǒng)總體設計
基于ARM的文本獨立筆跡鑒別系統(tǒng)主要由3個模塊部分組成,包括筆跡采集端、數(shù)據(jù)傳輸部分、上位機處理部分。系統(tǒng)的總體設計原理如圖1所示。

進行筆跡鑒別時,需要提前將書寫人筆跡數(shù)據(jù)存入系統(tǒng)數(shù)據(jù)庫中,以便于后期比對分析。待檢測人需通過筆跡采集端的手寫式觸摸屏實時輸入手寫筆跡信息。筆跡采集端進行簡單處理后通過數(shù)據(jù)傳輸部分傳送給上位機,上位機接收數(shù)據(jù)后采取筆跡鑒別算法對實時采集的筆跡信息進行預處理和歸一化操作。處理后的筆跡數(shù)據(jù)通過Gabor濾波器和支持
向量機方法與數(shù)據(jù)庫數(shù)據(jù)進行比對,從而實時顯示書寫者的身份信息。
2 基于ARM的筆跡采集端技術及設計
文本獨立的筆跡鑒別系統(tǒng)的筆跡采集端主要負責筆跡信息的實時采集及發(fā)送功能,主要由ARM核心處理器、觸摸屏模塊、書寫信息顯示模塊和數(shù)據(jù)發(fā)送端口組成。
2.1 筆跡采集模塊
觸摸屏部分是筆跡采集的關鍵核心,主要由電阻式觸摸屏和觸摸屏控制器組成,負責筆跡信息的實時采集。采集的數(shù)據(jù)信息將被實時保存成圖片格式并簡單處理后發(fā)送。電阻式觸摸屏的基層是玻璃。玻璃上面涂覆有兩層透明氧化金屬(ITO氧化銦)導電層,兩導電層之間有細小的透明隔離點,這些隔離點起到了將兩導電層隔離和絕緣的作用。當書寫者的筆尖或手指按下觸摸屏時,兩個導電層就會相互接觸而形成回路,通過測量接觸點的電壓值等特定數(shù)據(jù)就可得到屏幕上的坐標位置。采用電阻式觸摸屏具有價格低廉、型號齊全、耐筆尖或手指磨損、感應度高、精確性好等特點。
除了通過觸摸屏實時顯示書寫者的筆跡數(shù)據(jù)外,為了更便于書寫者觀察書寫,設計了專門書寫信息顯示模塊顯示筆跡信息。該模塊采用TFT液晶屏和液晶屏控制器組成。液晶顯示屏收到來自核心處理器的筆跡數(shù)據(jù)信息后,實時地將手寫筆跡顯示在屏幕上方,使得書寫者的筆跡輸入更加直觀。由于電阻式觸摸屏采集到的筆跡信息是當前觸摸點電壓值經過模數(shù)轉換后X坐標和Y坐標的數(shù)字值,對TFT液晶屏沒有使用價值,因而需要通過坐標轉換將觸摸屏坐標映射到TFT屏幕上。具體轉換過程可以由核心處理器及驅動程序完成。
筆跡采集端的核心處理器選擇三星公司ARM9內核的S3C2440A處理器,它負責整個筆跡采集端的運行控制,包括負責完成觸摸屏模塊的顯示和手寫數(shù)據(jù)的采集、書寫信息顯示模塊的數(shù)據(jù)輸出、數(shù)據(jù)通信模塊的管理控制,還負責包括坐標映射和簡單筆跡數(shù)據(jù)處理等功能。
2.2 數(shù)據(jù)通信模塊
數(shù)據(jù)通信模塊主要負責筆跡采集端采集的筆跡信息實時傳送到上位機端的功能。實現(xiàn)上位機與筆跡采集端的通信,主要包括有線和無線兩種方式。
有線通訊方式即通過實體數(shù)據(jù)線路進行連接,包括串口線、USB通信線等方式。其中,USB通信模塊是S3C2440A核心處理器的集成部分。S3C2440A核心內部包括USB控制器和外
圍電路,可以直接實現(xiàn)通過USB端口數(shù)據(jù)線將大量書寫數(shù)據(jù)實時準確傳送給上位機端的功能,具有簡單實用的特點。
為增加系統(tǒng)的可用性,實現(xiàn)相對較遠距離(10 m)的自由終端式筆跡采集模塊,可以采用基于無線通訊方式進行數(shù)據(jù)傳輸。目前較常用的無線通訊方式包括藍牙、Wi—Fi、基于nRF24L01工業(yè)模塊等方式。其中,nRF24L01是一款使用2.4 GHz ISM開放頻段、采用FSK調制、基于內部自有協(xié)議的無線通信模塊,本身擁有126頻道,可以實現(xiàn)點對點或1對多點的無線通信功能,通信速度可以達到2 Mbps。采用基于nRF24L01的工業(yè)化通信模塊可以實現(xiàn)較小體積較遠距離的數(shù)據(jù)傳輸,且開發(fā)方便,可以極大提高筆跡鑒別系統(tǒng)的實用性。
3 上位機文本獨立筆跡鑒別模塊的設計
文本的筆跡信息包括在線和離線兩類。離線信息是指寫在紙上的字符,具有采集方便、信息量小的特點。筆跡鑒別方法主要包括文本依存和文本獨立兩種,其中文本依存要求必須使用相同的文字進行比對,而文本獨立是依據(jù)大量筆跡特征提取,與書寫內容無關,應用更廣。本文針對離線的文本獨立筆跡信息進行研究,利用多通道Gabor濾波器,作為圖像紋理特征提取分析方法,它被廣泛應用于紋理分析、筆跡鑒別等領域。為了解決訓練樣本不足的問題,可以采用支持向量機(SVM)的方法對筆跡特征進行訓練和識別。上位機端的算法流程設計如圖2所示。

3.1 筆跡圖像預處理
筆跡圖像的預處理主要包括濾波、二值化、歸一化等。首先將圖像進行顏色聚類和二值化,以消除背景色的干擾,根據(jù)分布特征除去背景和網格線,并將圖像二值化。然后需要進行濾波以消除噪點的干擾,常用的圖像濾波方法有:中值濾波、鄰域均值濾波和低通濾波。由于筆跡采集終端采集的圖片質量較高,噪聲多為小噪聲的孤立點,因此可以采用鹽和胡椒濾波法去噪。然后將圖像分別沿水平和豎直方向進行投影,以壓縮空行和字符間的空白。為便于數(shù)據(jù)處理,需要按統(tǒng)一的行高對每行字符進行歸一化處理,即調整不同字符的大小相同。歸一化處理時可以根據(jù)筆跡圖像的水平直方圖做行的分割,圖像的水平直方圖就是圖像在水平方向上的投影,即每一行像素值直接相加。實驗中我們采集了20人的筆跡信息,每人兩份,每份的漢字數(shù)量、內容、紙張、書寫用筆均沒有特殊限制。與此同時,實驗還采用了哈爾濱工業(yè)大學多人手寫庫(HIT—MW)中的筆跡圖像作為樣本,共使用40份,由20個人書寫,每人兩份。對于采集的手寫筆跡信息,我們將每個人的筆跡信息一分為二,一份用于訓練,另一份用于測試,以保證兩組數(shù)據(jù)完全不同。實驗采集筆跡圖像預處理效果如圖3所示。
評論