一款功能强大的开源工具箱,旨在从复杂多样的 PDF 文档中高效提取高质量内容,包括布局检测、公式检测、公式识别及光学字符识别,适用于学术论文、教科书、研究报告和财务报表等多种文档类型,即使在扫描模糊或有水印的情况下也能保持高鲁棒性。