一种提升LLM性能的全新方法,能够把单一的LLM变身为全能的指挥家,通过高层元提示指令拆分复杂任务并分配给专家模型。
EmotionPrompt是一种将原始提示与情绪刺激相结合的方法,旨在通过情绪提示增强大型语言模型(LLM)的表现。
该项目是一个专注于大型语言模型(LLM)终身学习的资源库,收集了相关的精华综述、研究资源和论文,旨在促进LLM的持续学习能力和性能提升。
激活信标可以将LLM的原始激活压缩成更紧凑的形式,从而在有限的上下文窗口中感知更长的上下文。它通过短滑动窗口处理长上下文,同时保留LLM在短上下文上的原始能力,显著提高了长上下文语言建模和理解任务的表现。
self-adaptive-llms 是一个自适应框架,可以使大型语言模型实时适应未见过的任务,像是为模型装上“智能调节器”,从而在面对新任务时迅速调整,更好地完成任务。
哈佛大学出品的新论文,旨在提升LLM在TrucefulQA数据集上的正确率。该项目通过改进模型的输出和修正机制,使得大型语言模型在处理特定数据集时表现更佳。
HeartEcho 是一个集成了聊天室、语料库和炼丹炉的项目,旨在提供一个全面的环境用于实时交流、文本数据研究和模型训练。它支持大模型的增量学习,具备实时数据处理能力,并且提供用户友好的交互界面及可扩展的模块化设计。
RT-DETR(Real-time DEtection Transformer)是一种在速度和准确率方面均超越YOLO系列的先进物体检测模型,旨在提升计算机视觉任务的效率和效果。该模型采用高效的混合编码器和不确定性最小查询选择方法,支持灵活的速度调整和多尺度特征处理,在COCO数据集上表现出色。
DALLE-reproduction项目旨在重现OpenAI的DALLE模型,能够根据文本描述生成高质量图像,支持多种文本输入格式,并提供可扩展的模型架构和可调参数,以优化生成效果。该项目实现了多种训练和推理策略,适用于多种应用场景。
一个用于在互联网上高效、全球分布式训练人工智能模型的框架,具备弹性设备网络、异步分布式检查点、实时检查点恢复等特性,旨在优化全球范围内的AI模型训练过程