基于Rust语言实现的多语言文档OCR工具包,结合修改版Segformer、OpenCV和donut transformer,提供高效的文档识别与处理功能。
surya-rs的特点:
1. 支持多种语言的文档识别
2. 基于现代深度学习模型进行文本检测
3. 使用OpenCV进行图像处理
4. 高效的文档布局分析
surya-rs的功能:
1. 通过命令行接口进行文档识别
2. 集成到其他Rust项目中作为OCR模块
3. 处理图像文件和PDF文档进行文本提取
相关推荐
暂无评论...