该数据集包含从播客“津津乐道”的 281 集中提取的 18,663 个中文问答对。使用 OpenAI Whisper 转录工具提取字幕,并使用 GPT-3.5 生成问答对。
津津乐道 QA 数据集的特点:
1. 包含 18,663 个中文问答对
2. 使用 OpenAI Whisper 转录工具提取字幕
3. 基于 GPT-3.5 生成问答对
4. 可用于问答和文本生成等自然语言处理任务
津津乐道 QA 数据集的功能:
1. 用于训练问答系统
2. 用于自然语言理解的研究
3. 用于文本生成和对话系统
4. 用于语言模型的评估和测试
相关推荐
暂无评论...