Video-LLaMA 是一个基于 MiniGPT-4 的大型语言模型,旨在赋予其视频理解能力,开源模型包含中文跟英文版本。
JoyTag是一个开源图像标注模型,专注于积极性和包容性,使用Danbooru标注方案,适用于从手绘到摄影等各种类型的图像。该模型基于ViT-B/16架构,经过660M个样本的训练,支持5000多个标签,能够对输入图像输出对5000多个不同标签的预测结果。
BasicAI Cloud是一个提供AI驱动的训练数据解决方案的平台,专注于数据标注服务,连接AI工程师与标注专家,提升AI和机器学习模型的准确性。该平台拥有超过7年的经验,提供自动标注、对象跟踪和可扩展标签管理等功能。
People for AI是一家数据标注公司,提供专业的数据标注服务,以支持训练数据集。他们拥有经验丰富的标注团队、先进的标注工具和严谨的方法论,以确保最高质量的注释。
Unitlab是一个基于AI的平台,旨在帮助计算机视觉任务管理、标注和增强数据。它为机器学习团队提供了简单直接的数据标注工作流程。用户可以通过注册、上传数据、与人类标注者合作、使用AI助手审核和增强标注数据,最终利用这些数据训练机器学习模型。
PIXTA AI是一个为AI提供大规模数据标注和数据源服务的平台,拥有1000名经验丰富的标注员和超过7500万张图片及500万段视频,致力于加速AI开发,为各行业提供高质量解决方案。
LayerX.ai是一个端到端的AI数据管理平台,旨在便捷地收集、整理、标注和搜索大规模计算机视觉数据。它提供统一的基础设施,以捕获、存储、索引和搜索元数据、标签、模型运行及所有计算机视觉数据。
Innovatiana是一个专注于数据标注外包的平台,为AI模型提供高质量的数据注释服务,帮助企业高效完成模型训练、数据收集及处理任务。
Annotab Studio 是一个基于网页的工具,用于创建和管理数据注释。它为 AI 项目提供了无缝的数据平台,允许用户通过物体检测功能对图像进行标注和注释。
Appen是一个为创新的世界级AI应用提供支持的合作伙伴,拥有专业工具和技术,致力于使用人工智能建设更好的未来。
GPT4视觉用例集锦是一个集合了多种视觉任务的项目,基于最新的GPT-4模型,提供丰富的示例和用例,旨在帮助用户更好地利用视觉技术。该项目采用易于使用的API接口,支持图像分类、对象检测、图像生成和视觉问答等功能,适用于广泛的应用场景。
MagicAI是一个免费的在线AI图像生成器,用户可以轻松创建AI艺术、AI视频、海报等。只需访问网站,选择所需工具(如AI图像、AI视频等),输入内容,即可让AI为您生成输出。
Pyttipanna是一个为Pytti 5提供接口的框架,旨在利用机器学习模型创建和渲染视频。用户可以通过结构化、叙述和实验化视频创作的提示来实现自己的创意。
LLaMA-VID 是一个用于理解长视频的多模态大模型,通过双令牌策略显著减少了长视频的过载,同时保留了关键信息。
基于Node.js、Vue3、uniapp的AIGC平台,集成ChatGPT、Midjourney绘画、Suno音乐、视频服务等,支持私有化部署,适用于个人、团队和企业。该平台为用户提供了一站式的AI解决方案,能够满足不同用户的需求,包括创意写作、艺术创作和内容生成等。
Find That Vid是一个专注于帮助用户从最受欢迎的网站中发现成人视频的在线平台。用户可以通过简单的搜索功能,快速找到他们感兴趣的视频内容,并访问相关网站进行观看。该平台为用户提供了便捷的链接,确保他们能够轻松找到所需的视频资源。
Track Anything 是一个高效的目标跟踪项目,旨在实现视频中物体的准确跟踪与抠图,具有出色的实时性能和用户友好的界面。
Cogstudio是NVIDIA专享的高级Web UI,用于CogVideo视频生成与编辑,支持文本到视频、视频到视频、图像到视频以及视频扩展等功能,提供标签式工作流程,简化视频编辑过程。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型