智能機器人語音識別技術
3 機器人控制
機器人由自然條件下的語句進行控制。這些語句描述了動作的方向,以及動作的幅度。為了簡單起見,讓機器人只執(zhí)行簡單命令。由手機進行遙控,DSP模塊識別出語音命令,送控制命令到ARM模塊,驅動左右機械輪執(zhí)行相應動作。
3.1 硬件結構
機器人的硬件結構如圖4所示。本文引用地址:http://m.ptau.cn/article/161779.htm
機器人主要有2大模塊,一個是基于DSP的語音識別模塊;另一個是基于ARM的控制模塊,其機械足為兩滑輪。由語音識別模塊識別語音,由控制模塊控制機器人動作。
3.2 語音控制
首先根據需要,設置了如下幾個簡單命令:前、后、左、右。機器人各狀態(tài)之間的轉移關系如圖5所示。其中,等待狀態(tài)為默認狀態(tài),當每次執(zhí)行前后或左右轉命令后停止,即回到等待狀態(tài),此時為靜止狀態(tài)。
語音的訓練模板庫由4個命令加10個阿拉伯數字共14個組成,如下所示。
命令:“前”、“后”、“左”、“右”;
數字:“0~9”。
命令代表動作的方向,數字代表動作的幅度。當執(zhí)行前后命令時,數字的單位為dm,執(zhí)行左右轉彎命令時,數字的單位為角度單位的20°。每句命令句法為命令+數字。例如,語音“左2”表示的含義為向左轉彎40°,“前4”表示向前直行4 dm。
機器人語音控制的關鍵在于語音識別的準確率。表1給出了5個男聲樣本的識別統計結果。
4 結語
工作中,成功地將CHMM模型應用于定點DSP上,并實現了對機器人的語音控制。解決了CHMM模型巨大計算量及精度與實時性之間的矛盾。提出了一種新的端點檢測算法,對于對抗短時或較低能量的環(huán)境噪音具有明顯效果。同時需要指出的是,當語音識別指令增多時,則需要定義更多的句法,并且識別率也可能會相應降低,計算量也會相應變大。下一步研究工作應更注重提高大詞匯量時的識別率及其魯棒性。
評論