Hiera是一个层次化视觉变换器,专注于视觉任务,优化性能并避免不必要的复杂性。
Residual Attention是一种简单但有效的多标签识别方法,利用残差注意机制,能够在多标签任务中表现出色。
一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架,提供高性能推理和便捷的CLI接口。支持D-FINE等先进模型,具备视频流推理、自动分布式训练等特性。适用于需要transformer增强的目标检测任务,提供Python API和Docker部署支持。
CMT是一个结合卷积神经网络和视觉变换器优势的项目,旨在提升图像分类和目标检测的性能,具有广泛的应用前景。
FP-DETR是一个通过全预训练提高目标检测准确性的检测变换器。
计算机视觉Recipes项目提供了计算机视觉领域的最佳实践、丰富的代码示例和详细的相关文档,支持多种计算机视觉任务,如图像分类、目标检测等,旨在帮助开发者快速上手并实现各类计算机视觉功能。
GroupMixFormer是一种高效神经网络架构,基于Group-Mix Attention机制,旨在显著提升各种视觉任务的性能,特别是在图像分类、目标检测和语义分割等领域。