一个基于 LLM 的 OCR 扫描 PDF 开源工具,旨在通过利用多模态大语言模型(LLM)将原始的 OCR 扫描 PDF 文本转换成高准确度、格式正确且易于阅读的 Markdown 文档。
LLM-Aided OCR的特点:
1. 将 PDF 文件转图像进行处理
2. 高准确度的文本提取
3. 使用本地 LLM 或 API 纠正 OCR 错误
4. 最终转换为高质量的 Markdown 文档
LLM-Aided OCR的功能:
1. 将 PDF 文件上传并启动 OCR 扫描
2. 通过本地 LLM 或 API 进行文本纠正
3. 导出生成的 Markdown 文档
相关推荐
暂无评论...