Python安装PaddleOCR

PP-DocLayoutV3 文档版面分析模型v1.0

PP-DocLayoutV3 是飞桨(PaddlePaddle)开源的先进文档版面分析模型。该模型能够精准识别文档中的正文、标题、表格、图片、页眉页脚等十余类版面区域,并输出像素级坐标定位。针对中文文档优化设计,支持论文、合同、书籍、报纸等复杂版式的高精度分析。作为OCR前置引擎,可有效划分文字区域与图表区域,提升后续文字识别准确率;同时支持版面还原与结构化输出,广泛应用于档案数字化、智能文档处理

注意:我的系统是Ubuntu18.4

1 安装Paddle

github打不开,可以使用这个网站加速
https://hub.fastgit.org/

PaddlerOCR官网开发文档
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/README_ch.md

gitee上的开发文档
https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.2/README_ch.md

# 安装paddlepaddle(我用的是cpu版本)
python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
​
# 安装gpu版本paddlepaddle
python3 -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple

2 安装PaddleOCR

# 安装paddleocr
pip install paddleocr

安装时出现的问题

主要是安装python-Levenshtein引起的问题,直接安装XX.tar.gz文件是不行的,可以安装XX.linux.whl文件应该可以(但是我没找到linux版本)。

fatal error: Python.h: No such file or directory
#include <Python.h>
error: command 'x86_64-linux-gnu-gcc' failed with exit status 1

解决办法

# 一般情况下,直接安装下面的即可,建议用指定python版本的方法
sudo apt-get install python-dev
​
# 如果还不行,安装时指定python版本,不指定python版本可能还出现问题
sudo apt-get install python3.8-dev

3 PaddleOCR使用

from paddleocr import PaddleOCR, draw_ocr
​
# 'use_gpu=False'不用gpu,默认使用GPU
# 'use_angle_cls=True'自动下载相关的包
# 'lang="ch"'设置语言,支持中英文、英文、法语、德语、韩语、日语,参数依次为`ch`, `en`, `french`, `german`, `korean`, `japan`。
ocr = PaddleOCR(use_gpu=False, use_angle_cls=True, lang="ch")
img_path = './picture/my_001.png'
result = ocr.ocr(img_path, cls=True)
​
# line是一个列表' [[文本框的位置],(文字,置信度)] '
for line in result:
    print(line)

您可能感兴趣的与本文相关的镜像

PP-DocLayoutV3 文档版面分析模型v1.0

PP-DocLayoutV3 文档版面分析模型v1.0

PaddlePaddle
OCR
PDF

PP-DocLayoutV3 是飞桨(PaddlePaddle)开源的先进文档版面分析模型。该模型能够精准识别文档中的正文、标题、表格、图片、页眉页脚等十余类版面区域,并输出像素级坐标定位。针对中文文档优化设计,支持论文、合同、书籍、报纸等复杂版式的高精度分析。作为OCR前置引擎,可有效划分文字区域与图表区域,提升后续文字识别准确率;同时支持版面还原与结构化输出,广泛应用于档案数字化、智能文档处理

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值