汇集语音语言模型和端到端语音对话系统的论文、代码和资源,旨在为研究人员和开发者提供全面的支持和参考。
Unsupervised-TTS是由Cheng-I Jeff Lai开发的无监督语音合成系统,旨在利用无监督学习算法提高语音合成的质量和效率,同时支持多种语言,便于与现有系统集成。
ChatTTS-OpenVoice是一个个性化语音合成助手,通过上传10秒音频剪辑,融合了ChatTTS与OpenVoice技术,能够克隆用户的个性化语音,快速生成高质量的语音输出,提供易于使用的接口,满足用户的不同需求。
这是一个汇集了与GPT相关的多个开源项目的合集,提供对各个项目的简要介绍和链接,适用于研究人员和开发者寻找相关资源,并支持多种GPT相关的应用和工具。
一个综合性的资源库,为用户提供了大量关于上下文学习和提示工程的最新研究和技术。
Hugging Face 的官方博客,分享关于开源大模型、自然语言处理等领域的最新资讯和研究成果。
OSS Chat是一个创新的AI工具,旨在弥合开源软件社区与开发者之间的沟通鸿沟。它利用增强版ChatGPT的能力,整合文档、问题、博客文章和社区问答作为知识库,专为寻找高效信息和实时支持的开发者和开源爱好者量身定制。
文化NLP研究资源库:汇集文化自然语言处理领域的精选资源,涵盖研究论文、数据集、模型和应用,为跨文化语言技术研究提供参考和启发
Kimi k1.5 是一款多模态推理模型,能够在短期和长期上下文推理中表现出色,在各种任务中实现了最先进的性能。该模型支持长达128k个标记的上下文扩展,通过强化学习优化策略,结合文本和视觉数据进行联合训练。
StableVicuna是第一个通过强化学习人类反馈(RHLF)进行训练的大型开源聊天机器人,基于Meta的LLaMA模型,利用从ShareGPT收集的用户共享对话进行训练,旨在提供更自然和人性化的对话体验。