一种上下文学习方法,将基于提示的表示应用于自回归模型,以生成高质量的句子嵌入,无需微调。该方法通过利用上下文信息,避免了传统微调过程的复杂性,同时支持不同规模的语言大模型,能够在多种转移任务上取得最佳结果。
该项目是一个集指南和示例于一体的资源,涵盖了Gemini API的使用,包括编写提示的技巧、快速入门教程以及可构建事例,旨在帮助开发者高效利用Gemini API开发多模态应用。
OneYOLO是一个易于使用的目标检测框架,提供了从零开始深入学习YOLOv5的教程及源码剖析,帮助用户更好地理解和应用YOLOv5模型。
river-torch是一个基于PyTorch的Python库,专为在线深度学习而设计,支持实时数据的模型适应。它与River框架无缝集成,提供多种神经网络架构,并包含模型评估和性能监控工具。
GeneralAgent是一个通用的agent架构,具有简单、快速、稳定的特点。它支持序列化,内置多个解释器如Python和Shell,并允许用户动态创建UI界面。此外,用户可以通过自然语言描述直接生成agent,无需编程,极大地降低了使用门槛。
LLaMA.go是一个LLaMA模型的纯Go实现,类似于llama.cpp,但完全用Go编写。
一个开源项目,主要探讨和学习人工智能、深度学习的计算机系统设计,围绕着在华为昇腾工作中积累和构建的AI系统全栈内容。
LLaVA C++ Server 是一个用于LLaVA模型的高效推理的API服务器,旨在提供简单易用的接口,兼容多种平台与环境,支持模型的动态加载与卸载,并优化内存管理和性能。
gptme是一款可以在本地终端运行的个人AI助手,能够编写代码、使用终端、浏览网页和查看图像。支持多种操作和主流LLM提供商。
TaiChi是一个开源库,专注于少样本学习,可以支持多种自然语言处理任务,具有灵活的API设计和强大的可扩展性,适合研究者和开发者使用。
DocsGPT是一个开源文档助手,旨在帮助用户生成、提取和管理各种编程语言的文档。它支持多种文档格式,并提供智能搜索功能,用户可以轻松地找到相关信息。其用户友好的界面使得文档处理变得简单高效。
Azure Open AI demos是一系列详细的Azure开放AI技术演示,汇集了开放AI生态环的众多功能组件,通过实用案例帮助开发者高效开发AI应用。
利用AI协助软件设计和开发的工具,通过与用户的交互对话逐步捕获设计规范,而不是依赖单一提示,用户可以在命令行界面或Streamlit应用程序中使用它。
OneDiff是一个用于加速扩散模型的工具,提供了一种新的免训练、几乎无损的范式,显著提升模型的迭代速度。
《人体运动扩散模型》的论文代码,旨在高效生成和编辑人体运动,支持多种运动风格和动作捕捉数据。
该项目旨在通过可扩展的对数行列式计算来增强高斯过程核学习的效率,适用于大规模数据分析和预测。
MonkeyPatch 是构建可扩展的 LLM 驱动应用的最简单方式,随着时间推移,应用的成本和速度不断优化。
Inferflow是一个高效且高度可配置的大型语言模型推理引擎,旨在优化推理性能,支持多种自定义配置,以满足特定需求。
该研究开发了一种简化的自我训练方法,称为ReST^EM,该方法使用期望最大化(expectation maximization)来微调语言大模型(LLM),表现优于仅依赖人类数据进行微调的策略。
MLX Engine是一个开源项目,旨在利用Apple M系列芯片的硬件加速能力,以超快的速度和100%本地、离线的方式运行大型语言模型(LLM)。它能够在M3芯片上以约250 tok/秒的速度运行Llama 3.2 1B模型,始终以结构化JSON格式输出,支持通过代码或Chat UI与模型进行交互,并能同时运行多个模型,用户还可以从Hugging Face下载任何模型。
ComfyUI-3D-Pack是一个先进的3D输入处理套件,使用尖端算法(如3DGS、NeRF等)和模型(InstantMesh、CRM、TripoSR等)生成高质量的3D资产,使3D内容的生成像图像和视频一样便捷。
Loopquest 是一款专为具身智能体设计的生产工具,提供可视化界面,支持多种机器学习算法,并集成实时数据分析与监控功能,能够在多种硬件平台上运行,灵活的插件系统使其功能可扩展。
SWE-agent 是一个将语言模型(如GPT-4)转化为软件工程代理的工具,能够自动修复GitHub仓库中的bug和issue,并集成到现有的开发工具和环境中。它支持多种编程语言,旨在提升软件开发的效率和准确性。
Aviary是一个基于Gymnasium框架的语言模型Agent训练平台,专注于构建性任务,提供了灵活的训练环境和多种模型集成,旨在满足研究和应用中的多样化需求。
最全面的深度强化学习算法PyTorch实现合集,整合了13种主流强化学习算法,适合各级别研究者和开发者。每个算法都配有详细文档、完整训练曲线和论文引用,提供丰富的学习资源推荐,包括环境配置、经典书籍、在线课程和重要论文,确保用户能够顺利进行深度强化学习的实验和研究。
一个用C++/CUDA实现的大型语言模型(LLM)推理工具,不依赖额外的库,除了用于输入输出。该工具旨在提供高效的推理能力,支持加载和保存冻结的LLM权重,适合各种应用场景。
利用大型语言模型(LLM)驱动的NPC(非玩家角色)项目,旨在为游戏开发提供高性能的交互式角色,支持多种游戏场景,能够在本地硬件上运行,为开发者提供灵活的API接口,增强游戏的互动体验。
JARVIS是一个框架,利用像ChatGPT这样的语言模型,连接机器学习社区中的各种AI模型,从而解决复杂的AI任务。
Hugging Face关于如何构建AI Agent的课程,介绍了AI Agent的概念、构建高效Agent的关键组件、以及通过smolagents库实现这些代理的方法。课程内容丰富,适合想要深入了解AI Agent的学习者。
一个用于快速构建AI驱动界面的React组件库,基于RICH交互范式设计,提供原子化组件和完整的模型集成方案,支持对话流管理、主题定制,让开发者能轻松搭建企业级AI交互界面。蚂蚁开源的构建 AI web应用的框架,覆盖了多种常用的 AI 应用场景,比如 AI 聊天、输入框的快捷指令、AI 助手等。