一个通过坐标映射进行相机定位的神经框架。
基于CLIP(Contrastive Language-Image Pretraining)的研究成果汇总项目,旨在整理和分享CLIP相关的研究进展,包括CLIP的训练方法、改进、数据处理、知识蒸馏、损失函数,以及在零样本、少样本和分类等任务中的应用。
小型模型的妙用:在大型语言模型时代,探索小型模型的独特角色和应用,包括数据筛选、推理增强和知识蒸馏等