当前位置: 科技师 » 电脑知识 » 正文

PDF Craft – 基于AI的PDF文件格式转换器

PDF Craft(PDF文件格式转换器)简介

PDF Craft 是一个PDF文件格式转换器,开源免费,能够帮助我们非常方便地将PDF文件转换为多种其他格式,该工具能够逐页读取 PDF 文件,结合 DocLayout-YOLO 模型和自定义算法,从书页中提取文本,并过滤掉页眉、页脚、脚注和页码等元素。在跨页处理过程中,算法能有效解决前后页面之间的连接问题,最终生成语义连贯的文本。

该工具采用 OnnxOCR 进行文本识别,并使用 layoutreader 确定符合人类阅读习惯的阅读顺序。对于小型文档或论文,用户可以将 PDF 转换为 Markdown 格式,这一过程完全依赖本地计算能力,无需调用远程 LLM(大语言模型)。在遇到插图、表格和公式时,相关截图会直接插入到 Markdown 文件中。

对于较大的书籍(通常超过100页),推荐将其转换为 EPUB 格式。在转换过程中,该工具也会将本地 OCR 识别的数据传递给 LLM,以构建书籍的结构,并最终生成带有目录和章节的 EPUB 文件。此外,LLM 还可在一定程度上纠正 OCR 识别错误。

PDF Craft - PDF文件格式转换器

通过使用该工具,我们可以轻松实现从 PDF 到 Markdown 或 EPUB 的转换,提升文档处理效率,适合科研人员、学生及图书爱好者。

PDF Craft(PDF文件格式转换器)官网及安装教程

安装教程

首先需要 python 3.10 或以上(推荐 3.10.16)。

pip install pdf-craft
pip install onnxruntime==1.21.0

使用 CUDA

如果你希望使用 GPU 加速,需要确保你的设备以准备好 CUDA 环境,根据你的操作系统安装选择适当的命令安装。此外,将前文安装 onnxruntime 的命令替换成如下:

pip install onnxruntime-gpu==1.21.0
未经允许不得转载:科技师 » PDF Craft – 基于AI的PDF文件格式转换器

相关文章