AI开源项目

MinerU-开源PDF文档提取工具

上海人工智能实验室开源的PDF文档提取工具,能够将PDF转化为机器可读格式(如markdown、json),方便地抽取为任意格式。

上海人工智能实验室开源的PDF文档提取工具,能够将PDF转化为机器可读格式(如markdown、json),方便地抽取为任意格式。
MinerU的特点:
1. 将PDF文件转化为机器可读格式
2. 支持多种输出格式,包括markdown和json
3. 解决科技文献中的符号转化问题
4. 专注于提升科技文献的可访问性

MinerU的功能:
1. 使用命令行工具进行PDF文件转换
2. 集成到其他项目中以实现PDF数据提取
3. 对接大模型进行科技文献的分析和处理

相关推荐

暂无评论

暂无评论...