当前位置: 科技师 » 电脑知识 » 正文

Surya – OCR工具包

Surya(OCR工具包)简介

Surya是一款功能强大的文档OCR工具包,适用于多种类型的文档的OCR识别处理,如扫描件、图片、PDF、Word等。可帮助我们执行以下任务:

  1. 多语种OCR:支持90多种语言的光学字符识别,识别准确率与云端服务相当。
  2. 行级文本检测:能够检测任何语言的文本行及其边界框。
  3. 布局分析:识别文档中的表格、图像、标题等布局元素。
  4. 阅读顺序检测:确定文档中各文本区域的阅读顺序。

Surya - OCR工具包

该工具包的主要特点包括:

  • 高精度OCR:在广泛的基准测试中,Surya的OCR精度优于Tesseract,且接近谷歌云视觉的水平。
  • 跨平台支持:可在CPU和GPU上运行,GPU模式下速度更快。
  • 简单易用:提供了命令行工具和Python API,使用方便。

Surya(OCR工具包)官网

除了面向个人和研究用途的免费使用外,Surya还提供付费的商业授权选项,以资助其持续开发。

未经允许不得转载:科技师 » Surya – OCR工具包

相关文章