xiaozhi-esp32-server-mini

适配Xiaozhi的AI agent服务器程序

目标

本服务端致力于能跑到NAS, 路由器, 树莓派等轻量级设备，因此所有大模型均调用API服务

现状

使用Xiaozhi来进行对话。

没有联网能力

运行时内存

对话时大概76M
非对话时大概36M常驻内存

部署方式

Docker部署，镜像大概80M

前端(两个，分别是网页端和语音端)

一个Web前端用于调试AI Agent相关的功能(不需要启动EdgeMind服务)
Xiaozhi语音终端

当前使用的一些组件

SileroVad 用来提前去除一些非人类声音, 降低ASR的开销
ASR 使用了腾讯提供的服务，每个月5000次的免费额度足够了
TTS 使用了AzureTTS服务，每月10W字符，应该也够用了, AzureTTS不支持流式，目前是通过标点切分来实现流式TTS的。
Embedding 使用了硅基流动提供的免费API, 虽然有并发限制，在只有一个设备的情况下，并发也够了
大模型 分别使用了智谱AI和硅基流动提供的免费API, 同时使用可解决并发问题
向量数据库 使用了Redis-Stack提供的免费数据库，免费的32M内存目前应该也足够做记忆召回了

配置文件

配置文件, 里面包含了所有的配置信息，包括ASR, TTS, Embedding, 大模型, 向量数据库等

TODO

优化TTS延迟问题
接入喜马拉雅讲故事
基础知识库召回(主要是一些儿童读物，课本，防止大模型的幻觉让小朋友学到错误的知识)

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
.github/workflows		.github/workflows
audio		audio
backend		backend
edgemind		edgemind
frontend		frontend
models		models
proto		proto
tools		tools
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

xiaozhi-esp32-server-mini

目标

现状

运行时内存

部署方式

前端(两个，分别是网页端和语音端)

当前使用的一些组件

配置文件

TODO

About

Releases

Packages

Languages

License

findstr/xiaozhi-esp32-server-mini

Folders and files

Latest commit

History

Repository files navigation

xiaozhi-esp32-server-mini

目标

现状

运行时内存

部署方式

前端(两个，分别是网页端和语音端)

当前使用的一些组件

配置文件

TODO

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages