6.2 语音识别终端搭建
6.2 语音识别终端搭建
选用PS3 eye摄像头进行拾音,PS3 eye摄像头内置4个拾音麦克风,但并非专用的远场设别麦克风整列板,所以降噪处理的效果不太理想。当然,也有一些表现优秀的且适合树莓派的麦克风整列板,比如ReSpeaker 系列2mic、4mic、6mic,硬件上集成专用的音频处理芯片,配合语音算法,实现波束成形、噪声抑制、混响消除、回声消除等功能。但是考虑到专用麦克风整列板价格昂贵,文档资料较少,二次开发难度大,遂选用PS3 eye代替,PS3 eye使用USB直接与树莓派连接,不仅可以输出音频信号,还可以输出图像信号,且价格便宜。树莓派选用3b作为开发平台,使用16G的内存卡烧录最新的树莓派系统,作为树莓派启动盘。硬件一切准备工作就绪后,我们将开始下载安装dueros 基于Python语音开发的软件包,具体步骤如下:
- 1.因涉及修改系统文件,所以直接切换到root用户下操作
su – root - 2.在用户根目录下下载安装软件包,切换到用户根目录
cd ~/ - 3.使用git命令,到github上下载软件包
git clone https://github.com/MyDuerOS/DuerOS-Python-Client.git - 4.登陆dueros官网设备控制台,创建设备,配置授权地址。
- 5.在树莓派端进入DuerOS-Python-Clinent/app目录
cd DuerOS-Python-Clinent/app - 6.编辑当前目录的auth.py文件
vi auth.py - 7.将开发者信息替换为,注册设备的信息。
CLIENT_ID=“xxxx”
CLIENT_SECRET=“xxxx” - 8.返回上一层目录,启动授权文件
cd /home/pi/DuerOS-Python-Client/
./suth.sh - 9.打开浏览器,输入授权服务地址
http://127.0.0.1:3000 - 10.在授权页面登陆百度账号完成授权
- 11.运行语音服务器
./wakeup_trigger_start.sh
到此,树莓派3b语音交互的终端就搭建完成了,启动语音服务后,即可与树莓派正常交谈对话,也可以点歌,控制音乐播放暂停。但现在交互终端只相当于一款人工智能音箱,要想通过树莓派控制物联网设备,还需要部署用于逻辑处理对话的云服务器。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Mr.chen Blog!
评论