这是一个Chrome浏览器扩展,可以将YouTube直播中的评论实时转换为语音,使用VOICEVOX的zun-damon声音。只需安装该扩展,它会在直播期间自动将评论转换为语音,增强用户体验。
Moshi是由Kyutai Labs开发的语音到语音模型的演示项目,托管在Modal的GPU上,并提供了一个命令行客户端以实现实时对话。
Speechllect是一个AI驱动的平台,提供实时的语音转文本和文本转语音能力,利用SenseTheory数学理论分析每个词的含义,确保转换的准确性和上下文意义。