6.2 语音识别终端搭建

 选用PS3 eye摄像头进行拾音,PS3 eye摄像头内置4个拾音麦克风,但并非专用的远场设别麦克风整列板,所以降噪处理的效果不太理想。当然,也有一些表现优秀的且适合树莓派的麦克风整列板,比如ReSpeaker 系列2mic、4mic、6mic,硬件上集成专用的音频处理芯片,配合语音算法,实现波束成形、噪声抑制、混响消除、回声消除等功能。但是考虑到专用麦克风整列板价格昂贵,文档资料较少,二次开发难度大,遂选用PS3 eye代替,PS3 eye使用USB直接与树莓派连接,不仅可以输出音频信号,还可以输出图像信号,且价格便宜。树莓派选用3b作为开发平台,使用16G的内存卡烧录最新的树莓派系统,作为树莓派启动盘。硬件一切准备工作就绪后,我们将开始下载安装dueros 基于Python语音开发的软件包,具体步骤如下:

  • 1.因涉及修改系统文件,所以直接切换到root用户下操作
    su – root
  • 2.在用户根目录下下载安装软件包,切换到用户根目录
    cd ~/
  • 3.使用git命令,到github上下载软件包
    git clone https://github.com/MyDuerOS/DuerOS-Python-Client.git
  • 4.登陆dueros官网设备控制台,创建设备,配置授权地址。
  • 5.在树莓派端进入DuerOS-Python-Clinent/app目录
    cd DuerOS-Python-Clinent/app
  • 6.编辑当前目录的auth.py文件
    vi auth.py
  • 7.将开发者信息替换为,注册设备的信息。
    CLIENT_ID=“xxxx”
    CLIENT_SECRET=“xxxx”
  • 8.返回上一层目录,启动授权文件
    cd /home/pi/DuerOS-Python-Client/
    ./suth.sh
  • 9.打开浏览器,输入授权服务地址
    http://127.0.0.1:3000
  • 10.在授权页面登陆百度账号完成授权
  • 11.运行语音服务器
    ./wakeup_trigger_start.sh
     到此,树莓派3b语音交互的终端就搭建完成了,启动语音服务后,即可与树莓派正常交谈对话,也可以点歌,控制音乐播放暂停。但现在交互终端只相当于一款人工智能音箱,要想通过树莓派控制物联网设备,还需要部署用于逻辑处理对话的云服务器。
    Alt text