GradientJ旨在使NLP应用更易获取,提供创建、微调和管理NLP应用的综合解决方案,充分利用大语言模型的能力。
VLABench是一个大规模基准测试平台,专为公平评估视觉语言代理、具身代理和视觉语言模型而设计,提供长视野推理任务的支持,适用于多种任务和场景,旨在为研究人员和开发者提供标准化的测试环境。
一个社区驱动的LLM数据和基准测试资源库,提供大量语言模型的详细信息,包括模型参数、上下文窗口大小、许可证详情、性能指标等数据。通过llm-stats.com网站可以交互式探索和比较不同的语言模型。
一份精心收集机器人领域相关的3D视觉论文合集,包括政策学习、预训练、VLM和LLM、数据集和基准等相关论文、代码和相关网站。
SciBench旨在评估语言模型在复杂科学问题解决中的推理能力。通过开放和封闭数据集的深入基准测试,研究发现当前的语言模型在整体性能方面表现不佳,仅得到35.80%的分数。
RoboManipBaselines是一个集成了多种模仿学习方法和基准任务环境的软件,旨在为机器人操控提供基准和支持,提升学习效率与准确性。
TAG-Bench是一个用于回答数据库上的自然语言问题的项目,通过Table-Augmented Generation(TAG)模型,探索语言模型与数据库之间的广泛交互,提供首个基准测试研究TAG问题,并验证标准方法在此类查询上的挑战性。
一个全面的移动端和PC端智能代理相关资源集合,包含最新论文、数据集和基准测试。收录了各类移动端智能代理系统的训练方法、输入类型、模型架构等详细对比,以及主流数据集的详细信息统计。
BIG-Bench是一个用于评估神经网络模型性能的基准测量工具,旨在提供全面的评估方法,通过多个任务和指标来衡量AI模型的能力。
这是一个新的模型,超越其他模型在代理能力基准测试中表现出色,尤其在语言和编码任务上表现优异。
FraxAI是一个提供生成式AI模型、工具、提示工程技术、资源、指南和教程的平台,支持Stable Diffusion和ChatGPT等技术。用户可以探索各种可用模型和工具,利用提示工程技术创建有效的提示,以生成文本、图像、代码、音频、视频等。同时,平台还提供指南和教程,帮助用户深入了解生成式AI和提示工程。
Codegen是一款前沿的AI工具,利用GPT-4技术自动生成代码和解决项目问题,旨在提升开发效率和生产力。它与GitHub、Jira和Linear等流行平台无缝集成,是开发者和企业优化开发流程的不可或缺的工具。
Rochat是一款多用途的AI聊天机器人,涉及创作、学习、写作、编程、图像生成等多个领域,帮助用户快速生成文本和图像,节省时间和精力。
Mistral 7B是Mistral AI发布的首个大型语言模型,具备强大的适应性和自然编码能力,支持8k序列长度,超越Llama 2 13B的所有基准测试,采用Apache 2.0许可证,可免费使用。
CodeGeeX是一款大型多语言代码生成模型,拥有130亿参数,预训练于超过20种编程语言的大型代码语料库。它通过先进的AI算法,为开发者提供实时的编码建议和调试支持,简化编码任务,提升效率与准确性。
AI-生成内容致力于将所有AI生成器和内容类型整合在一个简单的订阅服务下。用户可以生成多种格式的内容,包括文字、图像、个人聊天机器人、与PDF对话、代码生成及语音转文本。只需简单描述内容主题并根据需求调整设置,输入品牌或产品的基本信息或关键词,AI算法将自动处理其余步骤。用户可以轻松查看、编辑或导出结果。
Answer Genie是一个让工程师和非工程师都能利用AI潜力的平台,提供代码生成、内容创作、市场分析、文本摘要、去除抄袭和问答等功能,帮助企业节省时间、金钱和资源。我们的AI技术旨在简化流程、改善客户体验,并提供有助于更好决策的洞察。
本项目基于Meta发布的可商用大模型Llama-2开发,开源了中文LLaMA-2基座模型和Alpaca-2指令精调大模型。这些模型在原版Llama-2的基础上扩充并优化了中文词表,使用了大规模中文数据进行增量预训练,进一步提升了中文基础语义和指令理解能力,相比一代相关模型获得了显著性能提升。相关模型支持4K上下文并可通过NTK方法最高扩展至18K+。