Skip to content

schorsch888/xiaozhi-esp32

 
 

Repository files navigation

An MCP-based Chatbot | 一个基于 MCP 的聊天机器人

(中文 | English | 日本語

视频

👉 人类:给 AI 装摄像头 vs AI:当场发现主人三天没洗头【bilibili】

👉 手工打造你的 AI 女友,新手入门教程【bilibili】

介绍

这是一个由虾哥开源的 ESP32 项目,以 MIT 许可证发布,允许任何人免费使用,或用于商业用途。

我们希望通过这个项目,能够帮助大家了解 AI 硬件开发,将当下飞速发展的大语言模型应用到实际的硬件设备中。

如果你有任何想法或建议,请随时提出 Issues 或加入 QQ 群:575180511

基于 MCP 控制万物

小智 AI 聊天机器人作为一个语音交互入口,利用 Qwen / DeepSeek 等大模型的 AI 能力,通过 MCP 协议实现多端控制。

通过MCP控制万物

已实现功能

  • Wi-Fi / ML307 Cat.1 4G
  • 离线语音唤醒 ESP-SR
  • 支持两种通信协议(Websocket 或 MQTT+UDP)
  • 采用 OPUS 音频编解码
  • 基于流式 ASR + LLM + TTS 架构的语音交互
  • 声纹识别,识别当前说话人的身份 3D Speaker
  • OLED / LCD 显示屏,支持表情显示
  • 电量显示与电源管理
  • 支持多语言(中文、英文、日文)
  • 支持 ESP32-C3、ESP32-S3、ESP32-P4 芯片平台
  • 通过设备端 MCP 实现设备控制(音量、灯光、电机、GPIO 等)
  • 通过云端 MCP 扩展大模型能力(智能家居控制、PC桌面操作、知识搜索、邮件收发等)

硬件

面包板手工制作实践

详见飞书文档教程:

👉 《小智 AI 聊天机器人百科全书》

面包板效果图如下:

面包板效果图

支持 70 多个开源硬件(仅展示部分)

软件

固件烧录

新手第一次操作建议先不要搭建开发环境,直接使用免开发环境烧录的固件。

固件默认接入 xiaozhi.me 官方服务器,个人用户注册账号可以免费使用 Qwen 实时模型。

👉 新手烧录固件教程

开发环境

  • Cursor 或 VSCode
  • 安装 ESP-IDF 插件,选择 SDK 版本 5.4 或以上
  • Linux 比 Windows 更好,编译速度快,也免去驱动问题的困扰
  • 本项目使用 Google C++ 代码风格,提交代码时请确保符合规范

开发者文档

大模型配置

如果你已经拥有一个的小智 AI 聊天机器人设备,并且已接入官方服务器,可以登录 xiaozhi.me 控制台进行配置。

👉 后台操作视频教程(旧版界面)

相关开源项目

在个人电脑上部署服务器,可以参考以下第三方开源的项目:

使用小智通信协议的第三方客户端项目:

Star History

Star History Chart

About

Build your own AI friend

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • C++ 77.5%
  • C 15.6%
  • Python 6.1%
  • Other 0.8%