该项目汇集了关于视觉生成模型评估的相关作品,包括评估指标、模型和系统的详细信息。
关于使用CommonGen-lite数据集对LLM进行评估的研究,使用了GPT-4模型进行评估,比较了不同模型的性能,并列出了排行榜上的模型结果。
这是一个关于大型语言模型(LLM)选项的全面集合,提供了分类清晰的资源列表,便于用户查找和使用。该项目定期更新,包含新的模型和工具,同时接受社区贡献和建议。
GPTs-DATA是一个综合性的数据库,包含超过13600个GPT模型、60多个导航网站和每周10多个独家提交门户。该项目致力于提供最新的GPT模型和资源,确保用户获取的信息始终保持新鲜和相关。
OpenAI Tools是一个综合工具包,旨在帮助用户充分利用他们的OpenAI账号。它提供了API使用情况跟踪、ChatGPT微调数据集管理、微调任务的创建、监控和取消、训练日志的审查和可视化、直接测试和比较微调及其他模型等功能。
一款助力强化学习训练的可视化工具,能让训练过程更易懂、调试更轻松,就像给复杂的训练流程装上了一扇透明的观察窗
thisorthis.ai 是一个平台,旨在比较、分析和分享多个AI模型的提示,以便通过数据驱动的比较来优化AI策略,帮助用户更快做出明智的决策。
AI Spend是一个帮助用户监控OpenAI使用和成本的工具,提供洞察和通知以防止费用惊讶,并允许用户跟踪API成本。用户需注册账户并添加OpenAI API密钥,设置后将开始检索使用历史,提供清晰的费用洞察,访问美观的仪表板,接收消费通知,分析使用趋势,发现模型和令牌使用情况。
Collie是一个多功能的AI模型训练与部署框架,旨在简化机器学习模型的开发和管理过程。它基于PyTorch,结合了DeepSpeed和MegatronLM,避免使用复杂的外部库,并提供用户友好的接口和多种内置工具。
这是一个为gpt-3.5-turbo模型提供的微调图形界面,通过简单易用的Web界面,用户可以自定义数据集进行微调,并实时查看训练进度和结果。
Contentable.ai是一个端到端的生成式AI测试平台,帮助用户在选择采用前对多个AI模型进行A/B测试。用户可以在一个屏幕上通过一次点击对比速度、成本和输出,同时支持所有主要的AI供应商。
这个项目展示了如何在Google Cloud上使用TensorFlow、TFX和Vertex AI实现端到端的机器学习运维。它集成了自动化的数据摄取、模型训练和评估,并提供了监控和日志记录功能,展示了机器学习中的CI/CD最佳实践。
灵活、健壮和高效的Python软件包,用于支持MLOps(机器学习运维)项目,提供多种工作流支持,优化性能,加速模型部署和监控,易于与其他工具集成,同时提供用户友好的API,确保模型和数据集的版本控制。
Efficient Large LM Trainer 是一款专为大规模语言模型设计的高效训练工具,旨在通过优化的算法和资源管理,提升训练速度并减少内存占用,支持多种硬件设备,便于用户集成和使用。
Gemini Pro vs Chat GPT是一个网站,允许用户实时比较Gemini Pro和Chat GPT的响应。用户可以输入提示,并同时获得结果以及性能指标。该网站专为需要快速比较见解的技术爱好者和专业人士设计。
一个专注于视觉自回归建模的资源汇总,展示如何让GPT风格的自回归模型在图像生成上超越扩散transformer,适合研究和开发图像生成模型的人员使用。
gpt-cli 是一个命令行工具,允许用户方便地与多个AI模型(如ChatGPT、Claude和Bard)进行交互。它支持通过命令行发送请求,易于集成到其他工具和脚本中,并且提供自定义配置选项,适合开发者和技术用户使用。
ArtificialAnalysis提供AI模型和API托管服务的客观基准和分析,帮助用户比较在项目中使用的最佳选项。我们整合了不同的质量基准、定价信息以及我们自己的技术基准数据。