智能機器人語音識別技術

作者：時間：2011-07-22 來源：網絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

3 機器人控制
機器人由自然條件下的語句進行控制。這些語句描述了動作的方向，以及動作的幅度。為了簡單起見，讓機器人只執(zhí)行簡單命令。由手機進行遙控，DSP模塊識別出語音命令，送控制命令到ARM模塊，驅動左右機械輪執(zhí)行相應動作。
3．1 硬件結構
機器人的硬件結構如圖4所示。

本文引用地址：http://m.ptau.cn/article/161779.htm

機器人主要有2大模塊，一個是基于DSP的語音識別模塊；另一個是基于ARM的控制模塊，其機械足為兩滑輪。由語音識別模塊識別語音，由控制模塊控制機器人動作。
3．2 語音控制
首先根據需要，設置了如下幾個簡單命令：前、后、左、右。機器人各狀態(tài)之間的轉移關系如圖5所示。其中，等待狀態(tài)為默認狀態(tài)，當每次執(zhí)行前后或左右轉命令后停止，即回到等待狀態(tài)，此時為靜止狀態(tài)。

語音的訓練模板庫由4個命令加10個阿拉伯數字共14個組成，如下所示。
命令：“前”、“后”、“左”、“右”；
數字：“0～9”。
命令代表動作的方向，數字代表動作的幅度。當執(zhí)行前后命令時，數字的單位為dm，執(zhí)行左右轉彎命令時，數字的單位為角度單位的20°。每句命令句法為命令+數字。例如，語音“左2”表示的含義為向左轉彎40°，“前4”表示向前直行4 dm。
機器人語音控制的關鍵在于語音識別的準確率。表1給出了5個男聲樣本的識別統計結果。

4 結語
工作中，成功地將CHMM模型應用于定點DSP上，并實現了對機器人的語音控制。解決了CHMM模型巨大計算量及精度與實時性之間的矛盾。提出了一種新的端點檢測算法，對于對抗短時或較低能量的環(huán)境噪音具有明顯效果。同時需要指出的是，當語音識別指令增多時，則需要定義更多的句法，并且識別率也可能會相應降低，計算量也會相應變大。下一步研究工作應更注重提高大詞匯量時的識別率及其魯棒性。