该项目是一个基于PyTorch实现的Spatial Transformer Network (STN),采用Thin Plate Spline (TPS)技术进行空间变换,能够灵活地对输入图像进行几何变换,支持高效的训练与推理。
DC-ShadowNet是一个基于无监督领域分类器引导网络的单图像硬软影子去除项目,旨在有效处理图像中的影子,提升视觉质量。
基于 Rust 和 ffmpeg 的视频解码库,旨在快速解码视频,特别适用于机器学习场景,在机器学习领域处理视频数据时,能高效地加载视频片段,避免了不必要的全视频解码,大大节省时间和资源
Transformers.js是一个在浏览器中运行Transformers模型的库,支持多种流行的深度学习模型,如BERT、T5、GPT-2等。它适用于多种任务,包括文本分类、翻译、摘要和问答,同时还支持自动语音识别和图像分类功能。该库提供了零样本图像分类和图像到文本的能力,方便用户在浏览器环境中进行各种深度学习任务。
一个高性能的Stable Diffusion实现,利用C++和CUDA加速图像生成,旨在提供快速而高效的图像生成能力,支持多种分辨率和预训练模型,易于集成和使用。
ComfyUI Workflows ZHO是一个高效的工作流,允许用户通过手绘方式快速生成3D模型。它集成了多种先进的控制网络和图像处理功能,确保生成的模型和图像具有高质量和语义一致性,满足不同用户的需求。
这是一个相机图像信号处理器(ISP)的软件实现,能够将简单的传感器输入图像转换成色彩丰富、细节清晰的输出图像,让图像质量大幅提升。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型