在多个粒度上分割和识别物体的通用图像分割模型。团队在SA-1B数据集、通用分割数据集(COCO等)和部件分割数据集(PASCAL Part等)上联合训练模型的首次尝试,并系统研究了在SA-1B上定义的交互分割任务和其他分割任务(如全景分割和部件分割)上多任务联合训练的相互促进作用。
CAST项目旨在通过图像分割和识别技术,实现层次化的图像处理,提升对象识别的能力。
NanoSAM是一个经过蒸馏的Segment Anything (SAM)模型,能够在NVIDIA TensorRT上实现实时推理,适用于各种图像分割任务。
Annotab Studio 是一个基于网页的工具,用于创建和管理数据注释。它为 AI 项目提供了无缝的数据平台,允许用户通过物体检测功能对图像进行标注和注释。
Hiera是一个层次化视觉变换器,专注于视觉任务,优化性能并避免不必要的复杂性。
Chinese LLaVA是一个支持中英文双语的开源多模态模型,能够进行视觉与文本的结合对话,具备高效的理解能力和灵活的应用场景,适合商用开发。
一款软硬协同的端侧全模态理解模型,具备图像、文本、音频三种模态数据的理解分析能力,以其高精度、高速度和简单易用性为核心价值
MiniGPT-4是一个开源的GPT-4版本,具备强大的视觉与文本理解能力,能够处理多种输入格式,适用于图像和文本的结合应用。该项目由社区驱动,旨在提升人工智能在多模态信息处理领域的效率和效果。
ARRTIFICIAL是一个强大的人工智能平台,利用先进的机器学习和深度学习算法,实现数据分析和预测建模的自动化。用户只需上传数据,选择所需的算法和参数,平台便可自动分析和建模。
Roboflow是一个综合平台,旨在帮助软件识别和分析图像和视频中的物体,适用于开发者和工程师,简化数据集创建、模型训练和生产部署的过程。
Grounded-SAM 通过整合多个工具,实现对图片中需要修改部分的识别和分割,提供强大的图像处理能力。
Hasty是一个集成平台,帮助用户从原始图像或视频生成可投入生产的AI模型,无需复杂的MLops技能或集成。
arivis Cloud是一个配备AI工具包的平台,允许研究人员训练AI模型,自动化和自定义他们的图像处理任务。用户可以注册账户,上传图像或数据,使用AI工具包选择所需任务,训练AI模型或应用预训练模型,定制工作流程,自动化图像处理。
FocalClick是一个旨在实现实际交互式图像分割的项目,能够在真实场景中应用,为用户提供高效的图像对象分割功能。
机器感知是一个自动化智能工具,允许用户搜索和过滤大型视频和图像数据集中的特定对象、异常、相似图像或3D特征。该项目旨在通过提供一个处理和搜索计算机视觉数据集的工具,将注释和标记成本降低10倍。用户只需上传大型图像或视频数据集,然后使用搜索和过滤工具,根据文本、相似图像或3D特征缩小数据集,最终提供过滤结果,帮助用户专注于需要注释的图像,从而节省注释和标记成本。
MVSplat360 是一个用于快速生成 360 度场景的项目,利用稀疏视图进行前馈生成,旨在为虚拟现实和增强现实提供高质量的场景合成。
Nyckel是一个利用AI自动标记图像和文本的平台,旨在简化分类过程,适合所有人使用,无需成为机器学习专家。用户可以在短短5分钟内构建自定义分类器,轻松处理图像排序、文本审核和实时内容标记等任务。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型