Autolabel是一个开源项目,主要提供Python库,用于自动标注、清洗和丰富文本数据集。该项目的目标是为机器学习提供大规模、干净、多样化的标注数据,并且具有高精度、低成本和快速启动的特点。它利用大型语言模型(LLM)来执行标注、清洗和丰富文本数据集的任务。该项目由refuel-ai在GitHub上进行维护。