该项目根据我们的调查整理了评估大型语言模型的文献,提供了全面的评价方法和研究资料。
这是一个关于大规模语言模型的精彩集合,汇聚了最新的研究成果和资源,包括论文、技术进展以及各种语言模型的比较和评估,支持社区的贡献和反馈。
一个关于大型语言模型系统相关论文的综合性列表,旨在为研究人员和开发者提供有价值的资源和参考。
关于大规模预训练语言模型工具使用和代码生成的论文集合,涵盖了相关研究和复杂推理的内容,提供对当前研究趋势的深入分析。
本书旨在概述大型语言模型的基本概念并介绍相关技术,重点在于大型语言模型的基础方面,而不是全面覆盖所有前沿方法。
该项目提供每周更新的机器学习领域内顶级论文,涵盖多个研究方向,并为用户提供论文摘要和关键点,支持用户提交和推荐优秀论文。
关于软件工程中Agent的资源列表,汇集了大量关于如何将大型语言模型(LLM)应用于软件工程领域的研究论文,帮助开发者和研究人员更好地理解和利用这些技术来提升软件开发的效率和质量
open-llms项目整理了可商用的大语言模型列表,并详细列出了各模型的许可协议,旨在为用户提供最新、全面的信息,方便用户在选择和使用这些模型时进行比较和决策。
能力密度是研究团队提出的评估不同规模 LLM 的训练质量的新指标,定义为模型的有效参数量与实际参数量的比值。该指标提供了统一的度量框架,通过引入参考模型的概念,建立参数量与性能之间的映射关系,显著降低同等性能的推理成本,并指示模型存在高性价比的有效使用期。
SciReviewHub是一个人工智能驱动的平台,利用AI技术快速、全面地进行科学写作和文献综述。它通过筛选成千上万的论文,识别相关信息,并呈现易于理解的综合评论,彻底改变了文献综述的过程,且立即为研究提供实用价值。
wizdom.ai利用人工智能帮助用户理解研究领域,提供有关主题、机构、国家、期刊和资助机构的见解。用户可以通过该平台分析趋势、识别合作者并可视化个人研究图谱。
这是一个关于自主AI代理的优秀项目和资源的精选列表,定期更新,涵盖多个类别,方便用户浏览,并提供相关研究论文和文章的链接。
Census GPT 是一个自然语言搜索引擎,用户可以通过人类语言查询人口普查数据库,快速获取所需信息。用户只需在主页的搜索栏中输入查询,系统便会理解并从数据库中提取相关结果,方便用户浏览和分析。
用于编辑大型语言模型的易用框架,其目标是在特定领域高效地修改LLM的行为,而不会对其他输入的性能产生负面影响。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型