Scan2AI是一个先进的Chrome扩展,用户可以捕捉屏幕的任意区域并将其发送到强大的AI API进行即时处理和洞察。
MiniCPM-V 是一款拥有 8B 参数的先进 AI 模型,性能优于 GPT-4V 等顶级型号,提供卓越的 OCR 功能,并支持 30 多种语言。
该项目提供了一种利用多模态半监督学习进行文本识别的方法,结合了标记和未标记数据以提高识别精度。