Math-Verify是一个强大的数学表达式评估系统,专为评估大型语言模型在数学任务中的输出而设计。它能更准确地评估模型的表现,避免因格式或解析问题导致的误判。
用于快速拟合神经场(neural fields)到整个数据集的库,为下游任务提供代表性的表示
关于如何有效蒸馏大型语言模型的最佳实践实用指南,提供了一系列的最佳实践,帮助工程师和机器学习从业者在生产应用中更高效地蒸馏和使用语言模型。
Inspect是一个用于评估大型语言模型性能的框架,提供多种评估指标与方法,支持不同类型的模型,易于与现有机器学习工作流集成,同时支持可视化和结果分析。
qlora-pipe是一个开源脚本,旨在通过在四块4090 GPU上进行定制训练,以高效的方式训练大型语言模型(LLM)。它支持多块GPU的并行训练,并提供多种配置选项以优化训练流程,确保用户能够根据不同的需求灵活调整训练参数。
llm-numbers是一个每个LLM开发人员都应该了解的工具,提供关键的统计数据和指标,帮助开发者深入理解模型性能。它支持多种语言模型的评估,并易于集成到现有的机器学习工作流中。此外,llm-numbers还提供可视化工具,以便展示模型数据,让开发者更直观地分析结果。
Tonic Validate Metrics 是一个开源的评估指标包,旨在为生成模型的输出提供多种评估指标,支持模型性能对比,易于集成到机器学习工作流,并兼容多种数据格式和输入类型。
一个简洁、易于修改的GraphRAG实现,提供了小型化、快速、清晰的GraphRAG核心功能,同时保持了可扩展性、异步处理和全面类型化
大型语言模型(LLM)的chat模板,用于支持transformers的chat_template功能,旨在为不同模型提供一致的输入格式,提供了多个流行模型的示例模板。该项目为开发人员提供了便捷的工具,简化了与不同语言模型的交互流程,确保输入格式的一致性,提高了开发效率。
用于在需求时自动加载模型的 HTTP 代理服务器,能根据请求动态切换 llama.cpp 或其他与 OpenAI 兼容的后端服务器,简化模型调用流程,提升使用效率。
SearchArray是一个基于Pandas的扩展数组,提供了词法匹配功能(如BM25),可以将Pandas的字符串列转换为词项索引,从而实现高效的短语和单词评分。
Giskard是一个用于大规模检测和测试机器学习模型的工具,能够自动检测幻觉和偏见。它支持自托管和云部署,集成了多个平台,如🤗、MLFlow和W&B,适用于从表格模型到大型语言模型的各种应用。
用于 LLaMA 3 8B 参数版本的轻量级 CUDA C 语言实现的推理引擎,旨在在 Nvidia GPU 上进行高效的并行处理。该项目旨在充分利用 Nvidia GPU 的性能,以提供快速的模型推理,并易于集成到现有的机器学习工作流中。
API for Open LLMs 是一个为开源大语言模型提供统一后端接口的项目,支持多种开源大模型的调用,旨在简化与大语言模型的交互体验。通过提供类似于 OpenAI 的 API 使用方式,开发者能够更方便地集成和利用大语言模型的能力。
Adot AI结合了ChatGPT的强大功能和丰富的Web3知识库,用户可以通过快速获取结果和定制化模板来轻松应对Web3世界的挑战。
openagent是一个模块化组件库和编排框架,受到微服务方法的启发,为开发人员提供构建强大、稳定和可靠的人工智能应用程序和实验性自主智能体所需的所有组件。它支持易于扩展和维护的设计,提升了系统的可伸缩性,适用于构建复杂的AI应用和自主智能体。
AI Superior GPT 是一个网页应用,用户可以通过聊天机器人界面与定制化的大语言模型进行互动。用户只需访问网站即可开始与聊天机器人对话,提问、交流并获取定制化模型的回答。
Punya AI 是一个由 AI 驱动的聊天机器人平台,允许无缝集成自定义数据,并提供品牌安全的保护措施。它使企业能够在没有编码知识的情况下构建和部署聊天机器人。