一个Python库,可轻松跟踪和可视化LLM的提示和输出。用户可以识别有效的策略,高效解决问题,并确保可重复的工作流程。
能力密度是研究团队提出的评估不同规模 LLM 的训练质量的新指标,定义为模型的有效参数量与实际参数量的比值。该指标提供了统一的度量框架,通过引入参考模型的概念,建立参数量与性能之间的映射关系,显著降低同等性能的推理成本,并指示模型存在高性价比的有效使用期。
本项目收录了关于大型语言模型(LLM)作为优化器的关键论文,并提供了自动优化相关文献的全面列表,专注于如何优化提示以提高LLM的性能,涵盖了最新的研究进展和技术。
OpenPipe是一个自托管的平台,旨在以数据驱动的方式快速生成、测试和比较LLM提示。用户可以轻松地在不同模型之间翻译提示,从而优化模型的表现。
Llog是一个为大型语言模型(LLM)设计的协作分析与洞察工具,能够通过简单的请求记录最终用户的交互,并便于所有商业利益相关者从这些日志中提取、分享和推导洞察。
Exifa是一个工具,旨在帮助用户了解嵌入在数字图像中的EXIF(可交换图像文件格式)数据的隐藏层次。它是首个将Snowflake Arctic LLM整合到其操作中的开源应用。
agentops 是一个 Python SDK,专为 AI 代理监控、LLM 成本跟踪和基准测试设计。它支持大多数 LLM 和代理框架的集成,包括 CrewAI、Langchain、Autogen、AG2 和 CamelAI,旨在帮助开发者和企业优化其 AI 代理的性能和成本效率。
nat.dev是一个开源的LLM(语言模型)测试平台,提供用户友好的界面,方便用户实验不同的LLM模型并分析其性能。用户可以创建账户,选择不同的模型进行测试,输入文本提示,生成响应,并评估生成的输出。该平台还允许用户自定义模型参数,适合高级用户进行微调。
允许用户将代码项目转换为 LLM(Large Language Model)提示的本地工具,专注于安全性、便捷性和用户体验。
这是一个讽刺性网站,旨在帮助他人学习如何使用基于LLM的搜索。用户只需输入问题,点击按钮,即可生成一个可分享的链接,并返回定制的搜索结果。
MusicGen模型训练器,旨在简化MusicGen和Audiocraft模型的训练过程,提供用户友好的界面和强大的功能,帮助用户轻松进行音频模型的训练和评估。
Langtrace是一个开源平台,用于监控、追踪和评估您的LLM驱动应用的性能。它自动生成与OpenTelemetry兼容的追踪信息,捕捉提示、完成、令牌计数、成本、模型超参数设置和延迟指标。Langtrace可以通过仅需两行代码快速集成。
AtomGPT是基于LLaMA的模型架构,通过从零开始训练,旨在展示模型的进化过程及学习能力的提升,帮助研究人员深入理解模型的学习过程。
JAX Synergistic Memory Inspector是一个用于检查JAX程序内存使用情况的工具,旨在优化性能。它可以帮助开发者识别内存瓶颈和低效之处,提供有关JAX张量的分配和释放的深入见解,能够与JAX工作流程无缝集成,并提供关于内存使用情况的详细报告和统计信息。
Skyvern-AI通过LLM和计算机视觉自动化基于浏览器的工作流程,提供一个简单的API端点来完全自动化手动工作流程,替代脆弱或不可靠的自动化解决方案。
OpenLIT是一个开源的GenAI和LLM可观测性平台,原生支持OpenTelemetry,能够在单一应用中集成追踪和指标。它是一个应用性能监控(APM)和可观测性工具,通过简单的一行代码即可简化集成过程,确保GenAI项目的顺利监控,支持包括OpenAI、HuggingFace等流行库和ChromaDB等向量数据库的项目。