实现了用Numpy库构建全连接神经网络和基于注意机制的transformer模型的最小化版本,代码行数少于650行,是一份值得参考的简化神经网络实现案例
神经网络是一个应用程序和网站产品,旨在以自然和直观的方式帮助用户学习和使用神经网络。它提供互动教程、可视化神经网络实验室,以及类似游戏的任务驱动学习方式。该平台提供优秀的可视化神经网络知识、深度学习模型和模型编辑器。
ChattyUI是一个开源且功能丰富的界面,类似于Gemini和ChatGPT,可以在浏览器中使用WebGPU本地运行开源模型(如Gemma、Mistral、LLama3等)。该项目不需要服务器端处理,确保您的数据始终保留在个人电脑上。
可以在本地运行起来的大数据模型,基于llama.cpp搭建的前端环境,通过网页访问大数据模型。
一个可以在犀牛3D建模软件中直接调用的模型生成插件,允许用户通过文字描述生成3D模型,并提供友好的用户界面和多种调整参数的功能。
nGPT是NVIDIA开发的标准化Transformer模型,基于nanoGPT进行改进,旨在提升训练效率和处理能力。它通过在超球面上的表示学习和标准化过程,实现了对低精度运算的更好鲁棒性,并在不同的上下文长度设置中提供了显著的训练加速。
AutoGGUF是一个自动化GGUF模型量化工具,提供友好的图形用户界面,利用llama.cpp库实现模型的高效量化。该工具支持多种后端管理,能够进行模型量化、参数配置以及资源监控等多种功能,旨在提升模型性能和资源利用率。
Brilliant推出的Introduction to Neural Networks课程
该论文打开了自注意力层如何组合输入token动态过程的黑盒子,并揭示了潜在的归纳偏见的性质。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型