TUMCC是一个用于识别Telegram地下市场中中文术语的语料库,旨在帮助研究者分析在线非法活动的语言特征。该语料库包含对各种术语及其含义的注释,并利用上下文和语言特征提高识别能力。
EnergeticAI是为无服务器功能优化的TensorFlow.js,提供快速冷启动、小模块大小和预训练模型,非常适合在Node.js应用中集成开源AI。
MinT 是一个轻量级、可扩展的Transformer库,专为自然语言处理任务而设计,提供易于使用的API,支持多种预训练模型,能够高效地进行模型训练和推理。
该项目专注于利用上下文感知分词来构建高效的世界模型,旨在提升智能体的学习与表现。
Byrdhouse AI提供基于AI的实时语音和字幕翻译,支持100多种语言,适用于会议、培训及活动,旨在帮助不同语言使用者建立更深的信任和联系。
提出 RetNet 作为 LLM 的基础架构,同时实现训练并行性、低成本推理和良好性能。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型