Skip to content

适用于 NAS、路由器、树莓派等轻量级设备的 xiaozhi-esp32 服务端

License

Notifications You must be signed in to change notification settings

findstr/xiaozhi-esp32-server-mini

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

xiaozhi-esp32-server-mini

适配Xiaozhi的AI agent服务器程序

目标

本服务端致力于能跑到NAS, 路由器, 树莓派等轻量级设备,因此所有大模型均调用API服务

现状

使用Xiaozhi来进行对话。

没有联网能力

运行时内存

  • 对话时大概76M
  • 非对话时大概36M常驻内存

部署方式

  • Docker部署,镜像大概80M

前端(两个,分别是网页端和语音端)

  • 一个Web前端用于调试AI Agent相关的功能(不需要启动EdgeMind服务)
  • Xiaozhi语音终端

当前使用的一些组件

  • SileroVad 用来提前去除一些非人类声音, 降低ASR的开销
  • ASR 使用了腾讯提供的服务,每个月5000次的免费额度足够了
  • TTS 使用了AzureTTS服务,每月10W字符,应该也够用了, AzureTTS不支持流式,目前是通过标点切分来实现流式TTS的。
  • Embedding 使用了硅基流动提供的免费API, 虽然有并发限制,在只有一个设备的情况下,并发也够了
  • 大模型 分别使用了智谱AI硅基流动提供的免费API, 同时使用可解决并发问题
  • 向量数据库 使用了Redis-Stack提供的免费数据库,免费的32M内存目前应该也足够做记忆召回了

配置文件

配置文件, 里面包含了所有的配置信息,包括ASR, TTS, Embedding, 大模型, 向量数据库

TODO

  • 优化TTS延迟问题
  • 接入喜马拉雅讲故事
  • 基础知识库召回(主要是一些儿童读物,课本,防止大模型的幻觉让小朋友学到错误的知识)

About

适用于 NAS、路由器、树莓派等轻量级设备的 xiaozhi-esp32 服务端

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages