Griffin是一种将门控线性RNN与局部注意力混合在一起的新模型架构,表现优于以往模型,能够处理长上下文并扩展到14B参数。该模型在训练数据量减少的情况下,仍能保持优异的表现,显著改善预测能力,并保留了Transformer架构在合成任务上的许多优点。
Cargoship是一个开源平台,允许用户轻松将人工智能集成到他们的应用程序中。它提供了一系列用于各种AI任务的预训练模型,如图像识别、语言处理、文本生成和音频转录。用户只需从其开源集合中选择一个模型,该模型以Docker容器的形式打包,便于托管或通过个人端点和API密钥访问,无需具备机器学习知识即可将模型整合到软件中。
ChatGLM-6B-API是基于清华大学开源的对话语言模型ChatGLM-6B和FastAPI构建的API,能够在本地部署并提供API接口,方便用户进行对话生成和自然语言处理。
AnythingLLM是您一直寻找的终极全能桌面AI应用和助手。它包含内置的LLM、RAG、AI代理,甚至自定义工具,旨在提高您的生产力,同时在您的桌面上完全本地和私密运行。
Tricksy是一款支持在单个GPU上进行快速推理的工具,利用稀疏感知卸载技术来提高推理效率和速度,同时优化资源使用,适用于深度学习模型的多种场景。
长上下文大型语言模型的高效推理加速工具,通过动态稀疏注意力机制,实现预填充过程的10倍速度提升,同时保持准确性,适用于A100等硬件平台
该框架将3D感知集成到预训练的2D扩散模型中,增强了得分蒸馏的鲁棒性和3D一致性,旨在解决2D扩散模型无法捕捉3D一致性的问题。
LangChain是一个先进的AI工具,旨在增强大型语言模型(LLM)应用的开发和部署。它为开发者提供了一个强大的框架,以更高效地构建、监控和部署LLM驱动的应用程序,适用于从初创公司到全球企业的多样化用户,简化AI在业务流程中的集成,提高运营效率,促进上下文感知应用的创建。
Kyanite是一个用Rust开发的神经网络推理库,支持CPU和Nvidia GPU,采用模块化设计,能够清晰地分割各个推理阶段,提供高效的内存管理和计算性能。
VQGraph重新思考图表示空间,旨在桥接图神经网络(GNNs)和多层感知机(MLPs),提供创新的图表示技术,提升图基机器学习任务的效率和效果。
研究人员设计了一种'好奇回放'算法,让AI智能体优先回放那些最有趣和新奇的经历,从中学习。这种方式让AI智能体表现出更多的好奇心和探索欲,更快地接近和与新物体互动。