ChatSQL 是一个能够将自然语言转换为 SQL 查询的工具,直接连接数据库进行查询,基于先进的 ChatGLM-6B/MOSS 模型,支持多种数据库,提供用户友好的接口。
闻达是一个大型语言模型调用平台,支持多种模型如chatGLM-6B、chatRWKV、chatYuan,以及基于chatGLM-6B的chatPDF功能,方便用户进行知识库查询和文本生成。
Retrieval-based-Voice-Conversion是一个基于VITS的声音转换框架,提供高质量的声音合成,并支持多种声音风格的转换。该项目具有友好的用户接口,易于集成和扩展,适合多种应用场景。
Slideflow是一个用于组织学图像分析的深度学习流水线,支持Tensorflow/Keras和PyTorch。它提供了一个便捷的环境来构建和管理图像分析工作流程,具有良好的可扩展性,可以满足各种图像分析需求。
使用sam和clip模型完成图像任意指定类别的实例分割,支持指定多个类别。该项目结合了SAM模型的高效实例分割能力和CLIP模型的类别识别能力,提供了一个用户友好的接口,适合各种计算机视觉应用。
Pipeless 是一个开源计算机视觉框架,用于创建和部署应用程序,无需构建和维护多媒体管道的复杂性。它提供了创建和部署高效计算机视觉应用程序所需的一切,这些应用程序只需几分钟即可实时运行。
融合图像聊天、分割和生成/编辑的AI应用概念验证项目,基于LLaVA、SEEM和GLIGEN三个相关开源项目实现。
使用LLMPerf工具对LLM推理提供商进行基准测试,通过关键指标评估它们的性能、可靠性和效率,展示结果的透明度和可视化
Midjourney API由The Next Leg提供,是一个非官方的API,允许用户与流行的AI图像生成工具Midjourney进行交互。用户只需注册订阅计划,获取API密钥,即可开始向Midjourney API发送请求,进行各种图像生成和创意项目。
YoutubeGPT利用OpenAI的Whisper、Embedding和Davinci模型,从YouTube视频中提取文本转录,分段嵌入,并允许用户通过聊天与视频内容进行交互,提供丰富的用户体验。
这是一个基于PyTorch的库,旨在加速在分布外(OOD)检测方面的研究,支持多种检测方法,并提供易用的API设计。该项目结合深度学习模型进行OOD任务,提供数据集和基准测试,且可与PyTorch深度学习框架无缝集成。
这是一个客户细分项目,探索结合大语言模型(LLM)和Kmeans算法的高级聚类技术及结果分析。
CAST项目旨在通过图像分割和识别技术,实现层次化的图像处理,提升对象识别的能力。
分享一个端到端的开源 OCR 模型,号称 OCR 2.0,支持场景文本、文档、乐谱、图表、数学公式等内容识别,拿到了 BLEU 0.972 高分。
这个项目能分析图像中对象之间的关系,是一个将Meta的Segment-Anything模型与ECCV'22论文相结合的演示:Panoptic Scene Graph Generation。
通过执行 OpenCLIP 模型的知识蒸馏,用零标记数据创建自定义图像分类模型。该项目利用现有的 OpenCLIP 模型,能够在没有标记数据的情况下进行图像分类,支持高效的模型训练和推理,适合各种自定义应用场景。