结合 fast-whisper-large-v3, Yi-34B-Chat-AWQ 和 XTTS-v2 的语音聊天项目,推理显存占用 33G。该项目提供高效的语音识别和合成,支持多种语言与方言,确保低延迟的语音交互,适合多种应用场景。