该项目提供了计算机视觉、自然语言处理和机器学习运维领域的丰富学习材料,适合各级学生使用。
整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。该项目收录了100+个中文LLM相关的开源模型和资源,适合企业应用和研究。
文章提出了一个七阶段的LLM微调流程,涵盖了从数据准备到模型部署的完整生命周期,提供了实用的技术和方法,以提升大规模语言模型的性能和应用效果。
该项目提供多个无审查的中文语言模型,支持多种文本生成任务,灵活选择与使用,开放访问,社区驱动更新。
Awesome_Multimodal是一个精心策划的GitHub项目,提供关于多模态大语言模型(MLLM)的全面资源集合。
phi-1.5是微软发布的一个具有13亿参数的语言模型,在自然语言处理和复杂推理任务上表现优异,其性能可与体量大5倍的模型相媲美。该模型遵循‘教科书就是你需要的一切’的原则,并且不使用爬虫爬取的互联网数据。
LLMSurvey是一个提供LLaMA模型族进化图的项目,用户可以通过该工具查看不同版本模型的性能,比较多种模型参数,并获取相关的训练和评估数据。
katakomba是一个专为NetHack游戏设计的数据驱动的基准测试工具,提供超过30个标准化数据集,并支持多种基于循环的离线强化学习基线模型,旨在促进研究和开发中的基准测试。
Acquire AI是一个AI市场和平台,用户可以发现、购买、构建和出售创新且可扩展的AI项目。它为AI爱好者、开发者和企业提供了一个全面的生态系统,以便探索、获取和协作AI项目。
Rig是一个用Rust开发的LLM应用开发框架,旨在构建可扩展、模块化的全栈AI应用,支持多种LLM提供商和向量数据库的整合,极大简化开发流程。
JoyGen是一款音频驱动的3D深度感知会说话的脸视频编辑工具,能够让视频中的人物根据音频自动做出逼真的表情和口型,为视频制作带来全新的体验。
InternLM-20B是一个由上海人工智能实验室与商汤科技联合香港中文大学和复旦大学开源的模型,拥有200亿参数,性能在众多维度上超越当前主流模型,旨在推动自然语言处理技术的发展与应用。
这是一个集合了最新、最前沿、有趣的针对大型语言模型(LLMs)的越狱方法的项目。它包括相关的论文、代码、数据集、评估和分析,旨在为研究人员提供多样化的越狱技术,适用于不同类型的LLM。
OpenAI o1是一个新的大型语言模型,通过强化学习进行训练,旨在执行复杂的推理任务。o1在回答问题之前会进行思考,能够产生长而复杂的内在思维链,确保回答的准确性和深度。
Valyu是一个综合平台,帮助用户处理AI训练数据的来源和许可问题。它提供了3000多个开放数据集的来源验证、清晰的许可和质量信息,用户还可以购买无冲突许可的多模态数据集。
2000 Fine Tuning Prompts是一个全面的资源,旨在帮助爱好者学习和实验微调,熟悉其在不同上下文中的功能和应用。
Graduate-Level Google-Proof Q&A Benchmark,是一个评估大型语言模型和可扩展监督机制能力的高难度数据集,包含448道选择题,旨在测试专家的准确率。