AI开源项目

nv-ingest-文档解析与内容提取微服务

英伟达发布的文档解析与内容提取微服务,能够处理大量复杂非结构化的PDF、Word等企业文档,提取文本、表格、图表和图像内容及元数据,支持并行化处理,提供OCR识别和向量化存储,...

英伟达发布的文档解析与内容提取微服务,能够处理大量复杂非结构化的PDF、Word等企业文档,提取文本、表格、图表和图像内容及元数据,支持并行化处理,提供OCR识别和向量化存储,适用于下游生成式AI应用
nv-ingest的特点:
1. 支持处理复杂非结构化文档
2. 提取文本、表格、图表和图像内容
3. 支持并行化处理
4. 提供OCR识别功能
5. 支持向量化存储
6. 适用于生成式AI应用

nv-ingest的功能:
1. 解析和提取PDF文档中的结构化和非结构化数据
2. 将Word文档内容转换为可检索的元数据
3. 处理大规模企业文档以供AI模型使用
4. 进行OCR识别以提取文本
5. 存储提取的内容以便于后续查询和分析

相关推荐

暂无评论

暂无评论...