dvc.ai 是一套用于机器学习数据管理、实验追踪和管道自动化的工具,旨在提升机器学习项目的效率和可重复性。它允许用户对数据和实验进行版本控制,自动化计算资源的管理,并跟踪和管理机器学习实验的过程。
这个项目展示了如何在Google Cloud上使用TensorFlow、TFX和Vertex AI实现端到端的机器学习运维。它集成了自动化的数据摄取、模型训练和评估,并提供了监控和日志记录功能,展示了机器学习中的CI/CD最佳实践。
Ambrosia是一个跨平台的命令行工具,专为优化和处理机器学习所需的文本数据集而设计。它提供多种功能来高效处理数据集,包括去重、过滤和长度检查,并支持基于大语言模型的独特过滤选项psort,旨在提高数据集的质量和使用效率。
AIPDFs是一个基于AI的文档解析工具,用户可以以10倍的速度上传和交互文档。通过先进的AI技术,工具自动解析文档,适用于多种场景,如财务、法律和学术文档的处理。
Data2Json是一个强大的API,能够即时将原始输入转换为结构化的JSON格式,帮助开发者轻松处理数据,避免繁琐的数据处理流程。该API具有可靠性和可扩展性,非常适合各种开发需求。
Union Cloud是一个旨在整合和简化AI、数据与分析的平台,提供生产级AI编排,能够将上市时间减少,并将样板代码和总管道成本降低多达90%。它基于Kubernetes的Flyte™,为机器学习微服务的构建、部署和管理提供了无忧的解决方案。
Showllable 是一个开源项目,旨在提供一个简化的方式来展示和分享机器学习模型。它支持多种模型格式,提供用户友好的界面,允许实时预览和分享功能,集成常用的可视化工具,并支持跨平台使用。
Vellum是一个用于构建大语言模型(LLM)应用的开发平台,提供了提示工程、语义搜索、版本控制、测试和监控等工具。该平台兼容所有主要的LLM提供商,支持快速实验、回归测试、版本控制以及可观测性与监控。用户可以利用专有数据作为LLM调用的上下文,比较和协作处理提示和模型,并在生产环境中测试、版本控制和监控LLM的变化。
ml-calibration是一个用于测量校准和绘制可靠性图表的工具包,提供了可视化方法来评估模型的校准程度,并生成可靠性图表以帮助分析模型的可靠性。该工具包支持多种校准方法的比较,易于集成到现有的机器学习工作流中。
LiteRT是Google AI Edge团队推出的高性能、可信赖的边缘AI运行时,旨在继承TensorFlow Lite的优势,并拓展其愿景,支持多种AI框架并优化资源利用率,方便集成和部署。
Roboflow是一个综合平台,旨在帮助软件识别和分析图像和视频中的物体,适用于开发者和工程师,简化数据集创建、模型训练和生产部署的过程。
Gemini是CMU的Graham Neubig教授团队开发的模型,经过与GPT-3.5-Turbo和Mixtrial的公平深入比较,显示出与GPT-3.5-Turbo相当的性能,尽管存在微弱的差距。该项目致力于提供可复制的研究结果,推动自然语言处理领域的进步。
Stellr是一个数字化工具,旨在帮助科学家记录和管理实验室工作。它现代化了传统的纸质笔记本方法,集中管理数据,以便快速搜索和协作,从而提高研究效率。用户可以轻松注册账户,创建项目,添加实验细节,上传文件并与合作者分享工作。Stellr还提供先进的搜索和组织功能,帮助用户保持有序并快速找到信息。
粒子生命物理模拟器是一款能够模拟粒子在重力场中运动的工具,用户可以自定义运动规则,实时渲染粒子动态,设置多种粒子属性,并通过交互式界面调整参数,以便深入理解粒子运动的物理原理。
基于FastAPI、MLflow和Streamlit的数字识别模型的完整部署实例,提供高性能API、模型管理和交互式界面,支持模型的训练和预测。
WebDB是一个开源的数据库集成开发环境,旨在提供高效的数据库管理和开发体验。用户可以连接服务器,利用现代的实体关系图(ERD)可视化数据库结构,生成智能数据,集成人工智能,管理NoSQL结构,并支持数据库版本控制。
Shumai是一个开源的、快速的、网络连接的可微分张量库,适用于TypeScript和JavaScript。