Surya(OCR工具包)简介
Surya是一款功能强大的文档OCR工具包,适用于多种类型的文档的OCR识别处理,如扫描件、图片、PDF、Word等。可帮助我们执行以下任务:
- 多语种OCR:支持90多种语言的光学字符识别,识别准确率与云端服务相当。
- 行级文本检测:能够检测任何语言的文本行及其边界框。
- 布局分析:识别文档中的表格、图像、标题等布局元素。
- 阅读顺序检测:确定文档中各文本区域的阅读顺序。
该工具包的主要特点包括:
- 高精度OCR:在广泛的基准测试中,Surya的OCR精度优于Tesseract,且接近谷歌云视觉的水平。
- 跨平台支持:可在CPU和GPU上运行,GPU模式下速度更快。
- 简单易用:提供了命令行工具和Python API,使用方便。
Surya(OCR工具包)官网
除了面向个人和研究用途的免费使用外,Surya还提供付费的商业授权选项,以资助其持续开发。