GPT Core用于创建和训练先进的大型语言模型(LLM),着重强调了其快速性能,可以在仅20分钟消费级GeForce RTX™ 4090上将自定义的1.23亿参数LLM预训练到约3.5的验证损失。
该项目是一个基于Colab的Gradio网页界面,旨在便捷地运行和使用多个已训练好的大语言模型,支持用户直接输入文本并进行生成,同时也允许使用自定义模型进行文本生成,适用于自然语言处理和文本生成等多个领域的研究和应用。
ark-nlp是一个旨在收集和复现学术与工作中常用的自然语言处理模型的平台,支持多种NLP任务,并提供丰富的预训练模型,适合研究人员和开发者使用。
这是一个完整的管道,用于在消费硬件上使用LoRA和RLHF微调Alpaca LLM。基于Alpaca架构实现人类反馈的强化学习(RLHF),基本上是ChatGPT的一个变体,但使用的是Alpaca。
一个用于文档级翻译的项目,基于大型语言模型(LLMs)进行实现,并进行了一系列实验以评估其性能。
基于LLM的系统,可帮助处理数据相关任务,连接不同领域和用户偏好的数据源,能自主管理、处理、分析、预测和可视化数据
由知乎和ModelBest公司开发的高性能LLM推理引擎,针对PCIe GPU优化,支持Llama等大模型变体。
GPUX是一个提供GPU资源的平台,旨在为AI和机器学习工作负载提供快速高效的处理能力。它具备无服务器推理能力,并利用StableDiffusionXL、ESRGAN和WHISPER等技术进行高性能处理。用户可以访问其于2023年4月20日推出的V2平台,按照指示部署AI模型并运行无服务器推理。GPUX还提供博客部分,包含发布信息、案例研究和AI技术。
这款开源(open-weight)的文本转音频模型可根据文本提示生成 44.1kHz 的高质量立体声音频。它非常适合合成逼真的声音和现场录音,可以运行在消费级 GPU 上,因此非常适合学术研究和艺术用途。