Mini-LLaVA是一款轻量级的多模态大语言模型,能够处理图像、文本和视频输入,实现高效且灵活的多模态数据处理。其设计旨在简化多模态应用的开发,提供了简约的实现和灵活的接口,方便用户进行快速开发和实验。
基于Gradio的WebRTC实时流媒体组件,支持网络摄像头视频流处理、服务器到客户端的视频/音频流传输、双向音频对话等功能,可用于构建实时对象检测、语音对话等AI应用,支持视频实时处理和音频流交互
S.A.T.U.R.D.A.Y是一个用于处理WebRTC、音频和AI的工具箱,基于Pion、whisper.cpp和Coqui TTS构建。
Trivoh是一款集聊天、视频、音频和白板协作于一体的应用程序,易于使用和设置,让用户能够专注于最重要的对话。
将树莓派变成一个低延迟的家庭安全摄像头,支持多人同时观看直播流。
QuickBlox是一个云通信平台,提供工具用于将实时沟通功能(如聊天和视频通话)集成到移动、网页和桌面应用中。除了SDK、API和UI组件外,QuickBlox还提供开源代码、现成的应用程序和AI集成。它以易用性和灵活性著称,使开发者能够快速实现沟通功能,而无需从头构建复杂的基础设施。
bark 是一款用于在本地网络中实现实时音频同步的工具,能够低延迟地将音频流媒体传输到多个设备,设置简单,使用方便,非常适合家庭和聚会场合的音频共享需求。
GPUDeploy是一个市场和软件解决方案,旨在以批发价格从可靠的计算提供商那里租赁低成本的按需计算资源。