Diarizers是一个用于微调pyannote说话人辨识模型的库,利用Hugging Face生态系统,提供了便捷的模型训练和评估功能。
本项目旨在利用合成数据,通过大语言模型从非结构化文档生成查询和相关文档,从而创建合成数据集,以微调开源嵌入模型。这样可以显著提高信息检索的准确性和效率,同时增强模型在特定领域的理解能力。