ERNIE是百度于2020年开源的生成式模型,旨在通过深度学习技术提高自然语言处理的能力。
Flow 是一个功能丰富的开源免费在线 ePub 阅读器,支持多平台使用,提供跨设备的无缝阅读体验,用户可以通过多种功能自定义和优化他们的阅读体验。
Mira (Mini-Sora) 是腾讯 PCG ARC 实验室推出的一个高质量长视频生成项目,旨在迈向类似 Sora 的视频生成技术。
filebrowser 提供了一个友好的Web界面,用户可以在指定目录下进行文件的上传、删除、预览、重命名和编辑。该项目支持多用户管理,每个用户可以拥有自己的目录,并允许用户通过API进行文件操作,适用于独立应用程序或作为其他项目的组件。
数据中心语言模型研究精选:汇总了数据为中心的语言模型研究领域内的趋势项目和优秀论文,包含大规模数据整理、数据质量评估、评估工具包等
Segment Anything是由Meta AI推出的图像分割大模型,专为图像分割任务设计,能够实现快速、准确的图像区域分割,支持任何物体的自动分割。该模型支持零样本转移到其他分割任务,无需标注训练数据,适用于各类图像分割应用。包含10亿的掩码数据集SA-1B,规模比现有分割数据集大400倍,提供开源代码和模型,支持实时视频流处理,具有高效推理能力和灵活的人机交互接口。
FlagAI是一个快速、易于使用和可扩展的大模型工具包,目标是支持在多模态的各种下游任务上训练、微调和部署大规模模型。
Linly是基于Falcon模型的增强版本,通过扩充中文词表并在中英文数据上进行增量预训练,旨在提升自然语言处理任务的效果。
这是一个聚焦于自然语言处理(NLP)领域因果关系研究的论文阅读列表,涵盖了相关的理论与实践研究,方便研究者进行文献查阅与学习。
adapt-demos是一个轻量级的工具集,旨在快速和轻松地演示大型语言模型(LLM)的功能,支持多种模型的比较与安全过滤,便于用户保存对话记录,简化AI模型的演示过程。
Mathberet是一个自托管的数字数学笔记本,使用React和Typescript开发,旨在为需要图形绘制、草图和LaTeX书写的平台的数学学生提供支持。
golangci-lint 是一个快速的 Go linters 运行器,支持并行运行 linter,使用缓存,支持 yaml 配置,并与所有主要 IDE 集成。
imageflow 是一个用于 Web 服务器的高性能图像处理工具,支持多种图像处理功能,能够高效地处理图像请求。
llama.vim是一个强大的Vim插件,旨在为开发者和文本编辑人员提供智能的代码和文本补全功能。它不仅支持自动建议,还允许用户手动切换建议,以便选择最合适的选项。此外,用户可以通过快捷键快速接受建议,并且插件还提供性能统计显示,帮助用户优化编辑体验。
clueai是一个开源的自然语言处理工具,用户可以在短时间内快速定制和部署自己的NLP API,旨在简化自然语言处理的集成过程,支持多种语言和模型,适合开发者和研究人员使用。
该项目提供丰富的学习路线图和Colab笔记本,帮助用户从基础知识到前沿技术,逐步掌握大型语言模型(LLM)的构建与应用。课程内容涵盖数学、Python编程、神经网络核心知识,以及如何构建高性能模型和开发部署LLM应用。
OpenAI的Whisper高质量语音识别模块C/C++移植版,支持在iOS和Android上运行,提供真人级别的识别效果,完全免费,具有开源、低内存和跨平台特性,适合资源受限环境。
一个开源的 AI 学习资料库,主要整理了人工智能、机器学习、深度学习、搜索系统、推荐系统、广告系统等领域的学习资料。
扩展了官方Gradio的高级版本,支持在图像上绘制框,旨在调整大型语言模型的指令,优化用户体验。
macOS-vz-kubelet使得macOS系统可以在Kubernetes上运行,允许苹果电脑作为节点来部署和管理macOS虚拟机,支持多种混合工作负载。
garak是一个用于检测不良提示响应的模块化工具,专注于LLM漏洞扫描,支持多种生成模型,旨在提升安全性和响应质量。
一个可让你快速、简单地创建个性化 GitHub 个人资料 README 文件的开源工具,提供可视化操作界面和丰富的元素以方便添加,内置三个主题模板,帮助用户快速创建美观的 GitHub 个人资料页。
这是一个关于大型语言模型(LLM)选项的全面集合,提供了分类清晰的资源列表,便于用户查找和使用。该项目定期更新,包含新的模型和工具,同时接受社区贡献和建议。
codeqai是一个本地优先的语义代码搜索和聊天工具,利用矢量嵌入和大型语言模型(LLMs)来提供高效的代码查询和理解。
运行一个大型AI小镇,基于RWKV智能体,支持本地部署,提供丰富的交互和定制体验。
NanoGPT是一个开源的轻量级语言模型训练工具,专为语言模型爱好者打造,适合在普通电脑上进行GPT架构的训练和实验。它通过精简架构、优化梯度计算和内存管理,使得在普通硬件上也能高效训练语言模型。
这是一个精心整理的机器学习工程课程列表,涵盖来自加州理工学院、哥伦比亚大学、伯克利、麻省理工学院和斯坦福大学的公开资源。
DDColor 是一种通过双解码器实现照片级真实感图像着色的方法,能够为历史黑白老照片和动漫游戏场景提供自然生动的上色。
Plandex是一个开源的、基于终端的AI编程引擎,专为解决复杂任务而设计。它利用长期运行的代理来完成跨越多个文件并需要多步骤的任务,能够将大型任务分解为更小的子任务,帮助处理积压的工作,并支持使用不熟悉的技术进行开发,减少在枯燥事务上的时间消耗。
TianMu是一个支持文心一言、通义千问、LLaMa、ChatGPT等多种大模型的开源客户端,能够在多个平台上运行,提供丰富的文档格式支持和多模态交互,用户可以通过持续对话和自定义命令与AI模型进行灵活交互。