利用Stable Diffusion算法和ControlNet合成航拍图像,数据集源自IGN的FLAIR(法国航空图像地面覆盖数据),用于法国各地区的地面覆盖信息。该项目结合了先进的图像生成技术,能够处理高分辨率图像,提供准确的数据支持。
WhisperPlus 是一款先进的语音转文本处理工具,致力于提供高准确率的语音识别,支持多种语言,并具备实时转录功能。它能够处理不同音质的音频,并提供用户友好的API接口,方便开发者进行集成和使用。
《人体运动扩散模型》的论文代码,旨在高效生成和编辑人体运动,支持多种运动风格和动作捕捉数据。
LLM-Tuning 是一个专注于简化大语言模型(LLM)微调过程的工具,支持多种模型与数据集,旨在帮助用户轻松实现模型训练与评估。
Phi2-mini-Chinese 是一个从零开始训练自己的Phi2中文小模型的项目,支持加载本地知识库进行检索增强生成(RAG),旨在提供强大的中文对话能力和灵活的训练选项。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型