一种提升LLM性能的全新方法,能够把单一的LLM变身为全能的指挥家,通过高层元提示指令拆分复杂任务并分配给专家模型。
WilmerAI 是一个框架,可以路由到不同的LLM并协同多个LLM一起使用,以增强模型的能力并完成复杂任务。
多智能体自动生成框架,基于LLM的自动智能体生成的实验性开源应用,由LLM驱动,自主生成多智能体以实现设定的目标。
Void是cursor的一个开源替代,使用AI工具写代码,对数据有完全的控制,支持对接不同的LLM大模型,能够索引本地文件,变成AI搜索引擎。
该项目证明可以将 LLMs 的工作负载分散到多个设备上并实现显著的加速,支持在低功耗设备上运行,兼容Llama 2 70B模型。
Optimum-NVIDIA将NVIDIA平台与Hugging Face结合,提供卓越的推理性能,通过简单的代码修改,使LLaMA 2模型达到每秒1,200个token的处理速度,比其他框架快28倍。
Orquesta是一个实时协作和无代码平台,利用大语言模型(LLM)能力,帮助企业集成和运营其产品。该平台集中管理提示、简化实验、收集反馈,并实时洞察性能和成本,兼容所有主要的LLM供应商,确保LLM操作的透明性和可扩展性,最终缩短客户发布周期并降低实验和生产环境的成本。