CheXagent是一个基于视觉和语言的基础模型,专注于胸部X光片的解读,旨在解决医学图像领域中大规模视觉-语言数据集的有限性等挑战。该模型利用大规模的指令微调数据集CheXinstruct,设计了一个临床大型语言模型(LLM)和一个用于表示X射线图像的视觉编码器,同时连接视觉和语言模态的网络,提供了新的评估基准CheXbench用于系统评估。
SurgicalSAM是一个高效的手术工具分割项目,支持类提示,旨在提升手术视频分析和医疗图像处理的效率。
本地部署全功能版stable diffusion,支持多种配置和功能,适用于深度学习图像生成任务。该项目允许用户在本地环境中生成高质量的图像,支持多种输入方式和参数设置,能够满足不同的生成需求。
MIMIC-CXR-VQA是一个复杂、多样且大规模的医学领域视觉问答(VQA)数据集,基于MIMIC-CXR数据库,旨在推动医学图像理解和问答系统的研究与应用。数据集包含多种类型的问题和答案,适用于模型的训练和评估,支持多种视觉问答任务。
Google Cloud Vision AI 是一款先进的人工智能工具,能够帮助开发者和企业理解和分析图像内容。利用谷歌的机器学习模型,Vision AI 提供了一套全面的图像分析服务,能够将图像分类到数千个类别,识别文本,检测物体等,彻底改变了与视觉数据的互动方式。
Ibex提供基于AI的癌症诊断解决方案,旨在提高癌症护理的准确性和效率,帮助病理学家和医生进行更好的诊断。
FreeTumor是一个大规模合成和分割肿瘤的基线工具,旨在帮助医学研究者扩展肿瘤分割数据集。该工具支持多种肿瘤类型,包括肝、胰腺、肾肿瘤以及COVID-19,具有高效的数据处理能力,适用于医学研究人员和数据科学家。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型