CachedEmbedding-动态管理嵌入表内存官网

基于ColossalAI的软件缓存方法来动态管理CPU和GPU内存空间中的极大嵌入表，能够在单个GPU上高效训练包括91.10 GB嵌入表的DLRM模型，仅需分配3.75 GB的CUDA内存，适用于大规模数据集。
CachedEmbedding的特点:
1. 动态管理CPU和GPU内存空间
2. 支持极大嵌入表的高效训练
3. 在单个GPU上处理大规模数据集
4. 基于ColossalAI的高效内存使用

CachedEmbedding的功能:
1. 用于训练DLRM模型
2. 适用于Criteo 1TB数据集
3. 可与PyTorch的EmbeddingBag结合使用

相关推荐

TI-32-将TI-84改装为智能作弊工具

TI-32是一款为TI-84计算器设计的改装工具，能够将其转变为作弊设备，支持Gemini API、分页响应以及回复GPT的功能，极大地扩展了计算器的用途和能力。

NLazyCat Bookmark Cleaner-高效书签管理工具

一款简单高效的书签管理 AI 工具，支持一键清理失效书签、重复书签和空文件夹，并提供分类统计和访问频率分析。

Long-Context-扩展LLM上下文长度的工具

LLM Giraffe🦒可以用来扩展LLM的上下文长度，它实现了将LLAMA v1 2K的上下文长度扩展为4K和16K，支持长文本处理，优化上下文管理，易于集成到现有的LLM工作流中。

Tiny Stable Diffusion-优化的稳定扩散，可在低资源环境中运行

Tiny Stable Diffusion是一个经过优化的稳定扩散模型，能够在仅有1GB VRAM的GPU上运行，适合低资源环境，支持生成高质量的图像，且易于安装和使用。

april-asr-C语言写的语音转文本库

april-asr是一个用C语言开发的语音转文本(STT)库，具备高效的语音识别算法和实时转录功能，支持多种语言，具有可扩展的架构，便于集成到其他项目中，适用于多种应用场景。

awesome-ai-painting-AI绘画资料合集

本项目是一个AI绘画资料的汇总，包含国内外可用平台、使用教程、参数教程、部署教程以及业界新闻等信息，旨在帮助用户更好地理解和使用AI绘画技术。

PULSE-中文医疗大语言模型-支持医学领域多种自然语言处理任务

PULSE模型使用约4,000,000个中文医学领域和通用领域的指令微调数据进行进一步调优，支持医学领域的各种自然语言处理任务。

AudioNotes-快速将音视频转结构化笔记的工具

AudioNotes 是一个开源免费的工具，能够快速将音频和视频内容转化为结构化的 Markdown 笔记，基于先进的 FunASR 和 Qwen2 模型构建，旨在提高用户的信息整理效率。

qlora-pipe-用于训练大语言模型的脚本

qlora-pipe是一个开源脚本，旨在通过在四块4090 GPU上进行定制训练，以高效的方式训练大型语言模型（LLM）。它支持多块GPU的并行训练，并提供多种配置选项以优化训练流程，确保用户能够根据不同的需求灵活调整训练参数。

tryEmoji-将表情符号转化为艺术图片

通过人工智能将表情符号转化为艺术图片，包括完整的前端和后端代码，支持本地和云端部署，完全基于开源，可用于商业用途

chat-todo-plugin

这个开源项目是ChatGPT插件开发指南，目的是提供开发ChatGPT插件的指导和支持。该项目包括两篇开发指南，作者已经开发了插件，但还没有得到放到应用商店的权限。

unit-minions-AI研发提效工具

包含 Llama （Alpaca LoRA）模型、ChatGLM （ChatGLM Tuning）相关 Lora 的训练，提供多种 AI 研发提效的工具和功能。

Segment Anything for Microscopy-基于SAM的显微镜分割和跟踪工具

该项目是一个基于SAM的显微镜分割和跟踪工具，旨在通过自动化技术提高显微镜图像分析的效率。它集成了先进的深度学习模型，能够支持显微镜图像的自动分割和细胞在时间序列中的变化跟踪，适合处理大规模数据集，并提供用户友好的界面。

Greppo-开源地理空间应用开发框架

Greppo 是一个开源的 Python 框架，用于快速搭建可交互式的地理空间应用，提供丰富的工具和简便的 API，适合开发者构建地图应用和处理地理数据。

Camel-AutoGPT

Camel-AutoGPT是一个开源项目，它是AutoGPT的变种。该项目的功能是在设定目标后，可以命名AI角色，让这些AI角色针对你的目标聊天对话，给你提示和启发。该项目旨在帮助用户实现他们的目标，并提供有用的建议和指导。用户可以与这些AI角色进行交互，获得有关如何实现目标的深入见解和建议。

NJanus Gateway-通用的 WebRTC 服务器

Janus Gateway 是一个通用的 WebRTC 服务器，旨在提供多种实时通信功能。它支持各种音视频流媒体，并具有插件架构，允许开发者扩展功能。Janus Gateway 提供多路复用和混音功能，支持视频会议、视频直播和音频通话，能够与现有的 SIP 和其他协议集成，适合构建复杂的实时通信应用。

TCM-Ancient-Books-中医药古籍文本，近700项

TCM-Ancient-Books项目收录了近700项中医药古籍文本，提供了文本的格式化和结构化，支持多种搜索和查询功能，为用户提供中医药相关知识的参考。

ChatFlow-围绕 ChatGPT 的简易工作流引擎

ChatFlow 是一个围绕 ChatGPT 构建的简易工作流引擎，旨在将做事的套路工具化，结合 AI 进行自动化。它允许用户创建灵活且用户友好的工作流，以高效地处理各种任务，并支持与 ChatGPT 的无缝集成。

暂无评论

暂无评论...