一款开源且强大的文档 OCR 工具,专注于文档图像的处理和分析,能够准确的逐行文本检测和识别,并且支持任何语言。
Surya的特点:
1. 支持 90+ 种多语言,包括中文、英文、日语、阿拉伯语等
2. 支持任何语言的行级文本检测,准确识别文档中的每一行文字
3. 支持文档布局分析,包括表格、图像、标题等
4. 支持复杂排版阅读顺序检测,如左右两列,能知道先读哪里,再读哪里
5. 支持精确识别表格中的行与列内容
Surya的功能:
1. 将文档图像上传至工具进行文本识别
2. 使用 API 接口进行批量处理和分析文档
3. 导出识别结果为文本文件或其他格式
4. 检测文档中的表格和图表
5. 处理多语言文档进行文本识别
相关推荐
暂无评论...