AI开源项目
Grounded-Segment-Anything
Grounded-Segment-Anything 是一个开源项目,它可以自动检测、分割和生成图像和文本。该项目是基于 Grounding DINO 和 Meta AI 开源的 Segment Anything 库构建的。
标签:caption data-generation open-vocabulary-det speech
Grounded-Segment-Anything 是一个开源项目,它可以自动检测、分割和生成图像和文本。该项目是基于 Grounding DINO 和 Meta AI 开源的 Segment Anything 库构建的。
相关推荐
AI-Waifu-Vtuber
AI-Waifu-Vtuber是一个基于VoiceVox Engine、DeepL、Whisper OpenAI、Seliro TTS和VtubeStudio等技术构建的AI伴侣虚拟YouTuber项目。该项目的功能包括生成具备人工智能语音和表情交互能力的虚拟YouTuber角色,支持在流媒体平台上进行直播并与观众互动。其中,VoiceVox Engine用于实现自然的语音合成,DeepL用于机器翻译,Whisper OpenAI用于自然语言处理和对话生成,Seliro TTS用于将文本转化为自然流畅的语音输出,VtubeStudio用于虚拟YouTuber角色的动作捕捉和控制,使其能够进行逼真的表情和动作交互。
暂无评论...