AI开源项目

text-extract-api-强大的文档处理工具

强大的文档处理工具,能将图片、PDF或Office文档高精度转换为Markdown文本或JSON结构化文档,还可用于去除文档中的个人身份信息。

强大的文档处理工具,能将图片、PDF或Office文档高精度转换为Markdown文本或JSON结构化文档,还可用于去除文档中的个人身份信息。
text-extract-api的特点:
1. 无需云依赖,本地运行
2. 高准确率
3. 支持转换图片、PDF和Office文档
4. 能够处理表格数据、数字和数学公式
5. 去除文档中的个人身份信息

text-extract-api的功能:
1. 将PDF文档转换为Markdown文本
2. 将图片中的文字提取为结构化JSON格式
3. 处理Office文档并输出高精度文本
4. 批量处理多个文档以提高效率

相关推荐

暂无评论

暂无评论...