SEPIA 服务器支持通过WebSocket连接进行开源语音识别,易于自定义与扩展,兼容多种语音识别引擎。
一个关于大语言模型(LLMs)的实用指南和食谱,旨在帮助用户更好地理解和使用这些模型。
Speakmulti是一个在线工具,可以将YouTube视频转换为多种语言,并使用真实的发音者声音进行配音,帮助用户实现多语言传播,适用于媒体、企业、电子学习和内容创作者等多种场景。
该项目是一个基于Colab的Gradio网页界面,旨在便捷地运行和使用多个已训练好的大语言模型,支持用户直接输入文本并进行生成,同时也允许使用自定义模型进行文本生成,适用于自然语言处理和文本生成等多个领域的研究和应用。
Huggingface Diffusers的OneFlow移植版,比PyTorch版性能更高,支持多种扩散模型,易于集成与使用。
一个自然语言处理任务与实例集,提供多种NLP任务的实现和示例。
So-vits-svc(也称Sovits)是基于VITS、soft-vc、VISinger2等一系列项目开发的一款开源免费AI语音转换软件。很多AI翻唱就是用Sovits训练的。
S.A.T.U.R.D.A.Y是一个用于处理WebRTC、音频和AI的工具箱,基于Pion、whisper.cpp和Coqui TTS构建。
whisperfile是一个基于llamafile的语音识别服务器构建工具,支持多种操作系统和CPU架构,提供快速启动和音频转换功能,旨在简化语音识别服务器的搭建过程。