上海人工智能实验室开源的PDF文档提取工具,能够将PDF转化为机器可读格式(如markdown、json),方便地抽取为任意格式。
MinerU的特点:
1. 将PDF文件转化为机器可读格式
2. 支持多种输出格式,包括markdown和json
3. 解决科技文献中的符号转化问题
4. 专注于提升科技文献的可访问性
MinerU的功能:
1. 使用命令行工具进行PDF文件转换
2. 集成到其他项目中以实现PDF数据提取
3. 对接大模型进行科技文献的分析和处理
相关推荐
暂无评论...