首个支持脑机交互的智能音箱项目 一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持 ChatGPT 多轮对话能力
一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持 ChatGPT 多轮对话能力,还可能是首个支持脑机交互的开源智能音箱项目。
一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,目的是让中国的 Maker 和 Haker 们也能快速打造个性化的智能音箱。wukong-robot 还可能是第一个开源的脑机唤醒智能音箱。
- 模块化。功能插件、语音识别、语音合成、对话机器人都做到了高度模块化,第三方插件单独维护,方便继承和开发自己的插件。
- 中文支持。集成百度、科大讯飞、阿里、腾讯、OpenAI Whisper、Apple、微软Edge、VITS声音克隆TTS 等多家中文语音识别和语音合成技术,且可以继续扩展。
- 对话机器人支持。支持基于 AnyQ 的本地对话机器人,并支持接入图灵机器人、ChatGPT 等在线对话机器人。
- 全局监听,离线唤醒。支持 Porcupine 和 snowboy 两套离线语音指令唤醒引擎,并支持 Muse 脑机唤醒 以及行空板摇一摇唤醒等其他唤醒方式。
- 灵活可配置。支持定制机器人名字,支持选择语音识别和合成的插件。
- 智能家居。支持和 小爱音箱、Siri、mqtt、HomeAssistant 等智能家居协议联动,支持语音控制智能家电。
- 后台配套支持。提供配套后台,可实现远程操控、修改配置和日志查看等功能。
- 开放API。可利用后端开放的API,实现更丰富的功能。
- 安装简单,支持更多平台。相比 dingdang-robot ,舍弃了 PocketSphinx 的离线唤醒方案,安装变得更加简单,代码量更少,更易于维护并且能在 Mac 以及更多 Linux 系统中运行。
首个支持脑机交互的智能音箱项目 一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持 ChatGPT ...
wukong-robot 的工作模式:
首个支持脑机交互的智能音箱项目 一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持 ChatGPT ...
被唤醒后,用户的语音指令先经过 ASR 引擎进行 ASR 识别成文本,然后对识别到的文本进行 NLU 解析,再将解析结果进行技能匹配,交给适合处理该指令的技能插件去处理。插件处理完成后,得到的结果再交给 TTS 引擎合成成语音,播放给用户。 虽然一次交互可能包含多次网络请求,不过带来的好处是:每一个环节都可以被修改和定制。而且我认为,到了 5G 时代,音箱的响应速度将不再成为体验问题。可定制和个性化才是未来的主流,而届时 wukong-robot 将会是更好的选择! Demo
首个支持脑机交互的智能音箱项目 一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持 ChatGPT ...
环境要求Python 版本wukong-robot 只支持 Python >= 3.7 且 < 3.10 ,不支持 Python 2.x 。 设备要求wukong-robot 支持运行在以下的设备和系统中: - Intel Chip Mac (不支持 M1 芯片)
- 64bit Ubuntu(12.04 and 14.04)
- 全系列的树莓派(Raspbian 系统)
- Pine 64 with Debian Jessie 8.5(3.10.102)
- Intel Edison with Ubilinux (Debian Wheezy 7.8)
- 装有 WSL(Windows Subsystem for Linux) 的 Windows
运行python3 wukong.py
建议在 tmux 或 supervisor 中执行。 第一次启动时将提示你是否要到用户目录下创建一个配置文件,输入 y 即可。 然后通过唤醒词 “snowboy” 唤醒 wukong-robot 进行交互(该唤醒词可自定义)。 此外,wukong-robot 默认在运行期间还会启动一个后台管理端,提供了远程对话、查看修改配置、查看 log 等能力。 - 默认地址:http://localhost:5001
- 默认账户名:wukong
- 默认密码:wukong@2019
建议正式使用时修改用户名和密码,以免泄漏隐私。

链接:https://pan.quark.cn/s/9b446d852c63
提取码下载:
|