pdf-extract-api-基于FastAPI的PDF提取工具官网

一个基于 FastAPI 的 PDF 文档提取和解析工具，使用最新的 OCR 技术和 Ollama 模型处理图像或 PDF 文件，转换为 Markdown 文本或结构化的 JSON 文档。
pdf-extract-api的特点:
1. 支持处理表格数据
2. 能够识别数字或数学公式
3. 使用 Redis 存储和缓存 OCR 结果，提高处理效率

pdf-extract-api的功能:
1. 将 PDF 文件转换为 Markdown 文本
2. 提取 PDF 文档中的结构化 JSON 数据
3. 处理图像文件并进行文本识别

相关推荐

NewsNow-优雅阅读实时热门新闻的工具

一个优雅地阅读实时热门新闻的工具，划分为国内、国际、科技、财经等几大类，涵盖了多个主流平台的新闻来源。

AI Comic Factory-轻松生成个性化漫画面板

AI Comic Factory利用大型语言模型和SDXL技术，帮助用户快速生成高质量的连环画面板。该项目由Hugging Face的Julian BILCKE提供支持，旨在为漫画创作者提供一个友好的界面，支持多种风格和主题的创作。

Fooocus

AI画图软件Fooocus是一个开源项目，它集成了Stable Diffusion和Midjourney的特点。它具有新图像生成、离线使用、开源、免费使用、简化操作等功能。用户可以通过输入提示词工程生成想要的图像，并且无需依赖网络连接。该软件是免费的，并且用户可以自由查看和修改源代码。用户可以在指定的项目地址中找到和获取该软件，它具有简单易用和多种功能的特点，主要用于AI出图。

Ctrl-G-适应性逻辑控制大型语言模型

Ctrl-G是一个为大型语言模型提供适应性逻辑控制的项目，旨在优化模型的输出，使其更符合用户的交互需求。该项目通过引入逻辑控制机制，提升模型的响应准确性和合理性。

ai-getting-started

这个开源项目是一个简单的AI入门项目，可以在GitHub上找到。它包含了AIGC中常用的图像和文本模型、向量存储、身份验证和项目部署等一整套流程。这个项目可以作为开发AI应用时的参考。

m3u-一份多类型直播源的收集列表

m3u 是一份直播源收集列表，包含了电视、直播、MyTV 以及体育等各类订阅链接，旨在为用户提供丰富的直播内容和便捷的使用体验。

FastMCP-快速构建MCP服务器的Python框架

FastMCP是一个快速构建Model Context Protocol(MCP)服务器的Python框架，提供了简洁的API接口来构建LLM上下文服务。它支持工具函数、资源访问、提示词模板等功能，特别适合为Claude等LLM应用提供数据和功能支持。

ML-NLP-机器学习与NLP面试知识与实现

ML-NLP项目涵盖了机器学习和自然语言处理领域的基本知识点，并提供相应的代码实现，旨在帮助用户准备面试和学习相关内容。项目包含常见的算法与模型实现，适合各类学习者与求职者使用。

Baichuan 2-新一代开源大语言模型

百川智能推出的新一代开源大语言模型，采用 2.6 万亿 Tokens 的高质量语料训练。在多个权威的中文、英文和多语言的通用、领域 benchmark 上取得同尺寸最佳的效果。

LLM-As-Chatbot-基于大语言模型的高效聊天机器人

一个基于大语言模型的聊天机器人项目，旨在提供高效、灵活的对话体验。该项目支持多种大语言模型的集成，具备灵活的对话管理系统和可定制的响应生成策略，同时支持上下文记忆功能，易于扩展和集成到现有系统，满足各种使用场景的需求。

Latex实例宝典-通过实例学习LaTeX的开源宝典

Latex实例宝典是一本以实例为基础的LaTeX书籍，提供了丰富的LaTeX实例，适合初学者和进阶用户，包含多种排版技巧和样式，旨在帮助用户掌握LaTeX的使用。该项目为开源，允许用户自由使用、修改和贡献自己的内容。

TensorZero-构建开源大型语言模型系统

TensorZero是一个开源基础设施，旨在支持生产级、可扩展和复杂的大型语言模型（LLM）系统。它集成了推理、可观测性、优化和实验功能，支持多步骤LLM系统，并通过ClickHouse数据仓库实现实时、可扩展且开发者友好的分析。

Developer Portfolios-为开发者提供灵感的作品集

一个为开发者提供灵感的个人作品集列表，汇集了众多开发者精心设计的个人网站，帮助你找到设计和展示自己作品的灵感

Flask-FomanticUI-轻松嵌入Fomantic-UI框架

Flask-FomanticUI是一个Flask扩展，旨在简化Fomantic-UI CSS框架的嵌入，提供便捷的组件使用和表单处理功能，同时支持自定义样式和主题，兼容Flask的所有特性。

N基于TensorPack的实现/模型集锦-多种预训练模型的集合

这是一个基于TensorPack框架的实现与模型集锦，包含多种预训练模型，适用于图像处理和计算机视觉任务，易于扩展和自定义。

NLocal AI Voice Chat-本地AI语音对话助手

基于Zephyr 7B模型使用自定义语音进行本地AI对话，使用RealtimeSTT和faster_whisper进行转录，使用RealtimeTTS和Coqui XTTS进行语音合成，提供了一个实时的聊天机器人，可以进行语音交互。

Agent Protocol-标准化的LLM代理API协议

LangChain推出的标准化LLM代理API协议，提供了Runs(执行)、Threads(多轮对话)、Store(长期记忆)三大核心功能模块，实现了代理服务的框架无关部署标准。

ProfileGPT-分析用户资料与个性

ProfileGPT是一款应用程序，能够分析用户的个人资料和个性，并提供基于ChatGPT的见解和反馈。

暂无评论

暂无评论...